The EU is in the process of creating an internal market for all types of data. The aim is to ensure that data can be shared from one stakeholder to another within the region, in accordance with the EU legislation. Data sharing requires interactive networks – data spaces – that can connect data providers and users, and offer a platform for them to communicate, make contracts and trade with each other.
All the upcoming European data spaces will be developed in line with the European Data Strategy. There are development plans for data spaces for approximately 15 different strategic fields. According to the vision, data spaces will allow for the commercialisation and more efficient re-use of data. This will benefit not only commercial stakeholders in the EU, but also EU citizens by providing them with better digital services, for example. In addition, researchers could gain access to new types of data and materials, which could boost basic research and increase opportunities for product development and innovation.
The European Language Data Space (shortened: LDS) is an ecosystem for the sharing and commercialisation of language data, such as text and speech data, and for the development of large language models and language-centric Artificial Intelligence. The Language Data Space is being developed and coordinated by the LDS Consortium, which was established in early 2023 with the support of the European Commission. The first phase of the LDS will last three years and during this period, the technical and legal framework for the operation of the common language data platform will be established in cooperation with the various stakeholders.
The work on the language data space will also be driven forward by ALT-EDIC, the language technology alliance of EU member states established in early 2024. In particular, ALT-EDIC aims to ensure the development of EU-based large language models.
The Language Data Space will be built partly on top of existing networks and language technology infrastructures. Sitra’s publication Snapshot of Finnish data spaces (2024) summarises well the current situation in Finland with regard to language technologies and the Language Data Space (in Finnish).
In spring 2024, the LDS Consortium launched a series of country-specific workshops to share information about the possibilities of the common Language Data Space, and to reach as many stakeholders in each member country as possible. The workshops are organised in collaboration with local institutions. In April 2024, Finland had the honour of being the first EU member state to host an LDS workshop. The event was organised locally by the University of Helsinki. More information on workshops in other EU countries and upcoming LDS events can be found on the Language Data Space website.
The Finnish LDS workshop provided an opportunity for organisations and companies in Finland to exchange ideas on the possibilities and challenges that a common platform and marketplace for language models and data could offer. As remote presenters, the workshop featured Philippe Gelin from the European Commission, and Georg Rehm from DFKI in Germany. In the panel discussions (see photos below), partners from the LAREINA project coordinated by the University of Helsinki shared their views on the importance of language data and on the challenges regarding the availability and technical quality of data or regarding copyright constraints. Without access to electronic data of sufficient quality and scope, it is difficult to develop language models for speakers of small and medium-sized languages.
After the LDS workshop, Finland initiated the membership process to join ALT-EDIC as an observer member. After summer 2024, the full membership of Finland in ALT-EDIC was confirmed for the next three years. The administrative representative of Finland in ALT-EDIC is the Ministry of Transport and Communications, with whom the University of Helsinki aims to maintain an active dialogue.
Language Data Space invites European stakeholders to join the LDS User Group. The group includes commercial stakeholders from different sectors as well as representatives from both public administrations and research. The news from the remote meeting of the LDS User Group in November 2024 can be found here. Joining the LDS User Group is done via a form that can be found on the LDS website. In particular, language data providers and utilisers, as well as language model developers, are warmly welcome to join the group.
At the end of 2024, the Language Data Space is entering the pilot phase, where the Language Bank of Finland is also actively involved. The aim is to test the pilot version of the LDS platform in Finland and to collect user feedback. The Language Bank of Finland is also planning to organise a workshop in spring 2025 on the Language Data Space, ALT-EDIC and copyright issues. We will inform about this upcoming event on our website and through the LAREINA project.
All photos in the article: Jyrki Niemi / University of Helsinki
EU luo parhaillaan kaikenlaiselle datalle sisämarkkinoita, joilla pyritään varmistamaan datan liikkuvuus alueen toimijoiden välillä EU:n lainsäädännön mukaisesti. Tähän tarkoitukseen tarvitaan vuorovaikutteisia verkkoja – data-avaruuksia – jotka voivat yhdistää datan tarjoajat ja käyttäjät ja tarjota heille alustan keskinäiseen viestintään, sopimusten laatimiseen ja kaupankäyntiin.
Kaikki vireillä olevat eurooppalaiset data-avaruudet kehitetään Euroopan datastrategian mukaisesti. Data-avaruuksia ollaan pystyttämässä jo noin 15 eri toimialalle. Tarkoituksena on, että niiden avulla dataa voitaisiin kaupallistaa ja tehostaa sen uudelleenkäyttöä. Tästä hyötyisivät EU-alueen kaupallisten toimijoiden ohella myös kansalaiset, kun esimerkiksi digitaaliset palvelut paranisivat. Lisäksi tutkijat voisivat saada pääsyn uudenlaisiin aineistoihin, mikä tukisi perustutkimusta ja parantaisi mahdollisuuksia tuotekehittelyyn ja innovaatioihin.
European Language Data Space (lyhenne: LDS) eli Eurooppalainen kielidata-avaruus on kielidatan, kuten teksti- ja puheaineistojen, jakamiseen ja kaupallistamiseen sekä suurten kielimallien ja kielikeskeisen tekoälyn kehittämiseen tarkoitettu ekosysteemi. Kielidata-avaruutta kehittää ja koordinoi LDS-konsortio, joka perustettiin Euroopan komission myötävaikutuksella alkuvuonna 2023. LDS:n ensimmäinen vaihe kestää kolme vuotta, joiden aikana on tarkoitus luoda yhteisen kielidata-alustan toiminnalle tekniset ja juridiset puitteet yhteistyössä eri sidosryhmien kanssa.
Kielidata-avaruuden edistämiseen osallistuu myös ALT-EDIC, alkuvuonna 2024 perustettu kieliteknologian allianssi, jonka jäseninä ovat EU-valtiot. ALT-EDICin tavoitteena on varmistaa etenkin EU-lähtöisten suurten kielimallien kehittäminen.
Kielidata-avaruutta rakennetaan osin jo olemassa olevien verkostojen ja kieliteknologisten infrastruktuurien päälle. Sitran julkaisu Suomalaisten data-avaruuksien tilannekuva (2024) kiteyttää hyvin Suomen tilanteen kieliteknologioiden ja kielidata-avaruuden osalta.
LDS-konsortio käynnisti keväällä 2024 maakohtaisten työpajojen sarjan, jotta tieto yhteisen kielidata-avaruuden mahdollisuuksista kantautuisi eteenpäin ja tavoittaisi kunkin jäsenmaan sidosryhmiä mahdollisimman laajalti. Työpajat järjestetään yhteistyössä paikallisten toimijoiden kanssa. Huhtikuussa 2024 Suomella oli kunnia olla ensimmäinen EU:n jäsenvaltio, jossa toteutettiin LDS-työpaja. Paikallisena järjestäjänä toimi Helsingin yliopisto. Muissa EU-maissa järjestettyihin työpajoihin sekä tuleviin LDS-tapahtumiin voi tutustua Language Data Spacen verkkosivuilla.
LDS-työpaja tarjosi Suomessa toimiville organisaatioille ja yrityksille tilaisuuden vaihtaa ajatuksia siitä, millaisia mahdollisuuksia ja haasteita yhteinen kielimallien ja -datan jakelualusta ja kauppapaikka voisi tarjota. Työpajassa vierailivat etäpuhujina Philippe Gelin Euroopan komissiosta sekä Georg Rehm DFKI:sta, Saksasta. Paneelikeskusteluihin (ks. kuvat alla) osallistui Helsingin yliopiston koordinoiman LAREINA-hankkeen yhteistyökumppaneita, joilla on kokemusta kielidatan merkityksestä sekä tietoa haasteista, jotka liittyvät datan saatavuuteen, tekniseen laatuun tai tekijänoikeuksien tuomiin rajoitteisiin. Jos riittävän laadukkaisiin ja laajoihin sähköisiin aineistoihin ei ole pääsyä, on vaikea kehittää omia kielimalleja pienten ja keskisuurten kielten puhujille.
LDS-työpajan jälkimainingeissa Suomi käynnisti jäsenyysprosessin ja liittyi ALT-EDICiin tarkkailijajäseneksi. Kesän 2024 jälkeen vahvistettiin myös Suomen täysjäsenyys seuraaviksi kolmeksi vuodeksi. Hallinnollisesti Suomea edustava taho ALT-EDIC-asioissa on Liikenne- ja viestintäministeriö, jonka kanssa Helsingin yliopisto pyrkii pitämään aktiivisesti yhteyttä.
Language Data Space kutsuu eurooppalaisia toimijoita mukaan LDS-käyttäjäryhmään. Mukana ryhmässä on eri alojen kaupallisia toimijoita ja julkishallinnon sekä tutkimuksen edustajia. LDS-käyttäjäryhmän marraskuussa 2024 järjestetyn etätapaamisen kuulumisia voi lukea verkkouutisesta. LDS:n sivuilla on myös käyttäjäryhmän liittymiskaavake. Ryhmään ovat tervetulleita erityisesti kielidatan tarjoajat ja hyödyntäjät sekä kielimallien kehittäjät.
Vuoden 2024 lopulla Language Data Space on siirtymässä pilotointivaiheeseen, jossa myös Kielipankki on aktiivisesti mukana. Tavoitteena on testata Suomessa LDS-alustan pilottiversiota sekä kerätä siitä käyttäjäpalautetta. Kielipankki suunnittelee myös järjestävänsä keväällä 2025 työpajan, jonka aiheina ovat LDS:n ja ALT-EDICin lisäksi tekijänoikeusasiat. Tiedotamme tapahtumasta myöhemmin verkkosivuillamme sekä LAREINA-hankkeen kautta.
Artikkelin kuvat: Jyrki Niemi / Helsingin yliopisto
Organizers:
Department of Digital Humanities, University of Helsinki
LAREINA project
Kites ry
Location:
Clarion Hotel Helsinki, Tyynenmerenkatu 2, Helsinki
The development of language-centric AI during the past few years has been remarkable. It poses challenges but also creates opportunities for organizations both in the private and the public sector. Many of us are curious about how to harness the power of AI in our own business.
Our workshop on Large Language Models and Speech-Centric AI will showcase various use cases and applications both in the public and private sector. Our objective is to introduce the current state of language-centric AI in Finland, and share information about the future of access to language data and modules. The demo presentations and industry talks will illustrate the potential use of language-centric AI.
This workshop is addressed to developers, integrators and users of language technologies and AI solutions in Finland. The workshop will be held in English and on-site only.
Participation is free of charge, but registration is required. We have 50 seats available. Registration has now ended and the event is fully booked.
08:30 – 09:00 |
Registration and Coffee |
09:00 – 10:30 |
LLMs and Speech-Interfaces in Private and Public Sector |
10:30 – 11:30 |
Demo Presentations and Coffee |
11:30 – 13:00 |
AI and Speech-Interfaces |
13:00 – 14:00 |
Lunch |
lareina-office [ATT] helsinki.fi
Last updated: October 8, 2024
To view or to download the PDF version, click on the image.
The goal of the workshop is to let the whole infrastructure reflect on how SSH research will be affected by AI and how we as an infrastructure should prepare for this. In addition, we need to collect information on what preparations are already taking place in the different locations of the infrastructure.
The goal of the workshop is to let the whole infrastructure reflect on how SSH research will be affected by AI and how we as an infrastructure should prepare for this. In addition, we need to collect information on what preparations are already taking place in the different locations of the infrastructure.
11.00-12.00 Keynote: Modern generative image modelling, Jaakko Lehtinen (Aalto University)
12.00-13.00 Lunch
13.00- Group discussions. Task: Brainstorm and develop an action plan for how to integrate transformer technology in the research infrastructure development (Tentative questions: AI for diverse data types? What is happening across locations? Making AI accessible and usable? Implications for SSH research, development, education?)
14.10-14.30 Coffee
14.30-15.00 Summaries from the groups
15.00 Poster session & Refreshments
16.00 Closing
Järjestäjät:
European Language Data Space
Digitaalisten ihmistieteiden osasto, Helsingin yliopisto
Eurooppalainen kielidata-avaruus (European Language Data Space, LDS) ja Helsingin yliopisto kokoavat yhteen suomalaisen teollisuuden, julkishallinnon ja tutkimuksen asiantuntijoita keskustelemaan kielidatan merkityksestä kieliteknologioiden ja tekoälypohjaisten työkalujen kehittämiselle Suomessa. Tilaisuus järjestetään 10.04.2024 Clarion Hotel Helsingissä.
Vuoden 2023 alusta lähtien Euroopan komissio on ohjannut ja tukenut uutta tapaa jakaa kielidataa Eurooppalaisen kielidata-avaruuden (LDS) kautta. Tämä uusi tapa ulottuu kielidataa laajemmalle, ja se kattaa monia aloja ja toimintaympäristöjä niiden niiden omien data-avaruuksiensa kautta. Yhteiseurooppalaisten data-avaruuksien (Common European Data Spaces) perustamisen myötä tiedotus ja välitys datan eri tiedonkuvaus- ja saatavuusmuotojen välillä on toteutumassa kaikissa Euroopan maissa.
Tätä taustaa vasten Eurooppalaisen kielidata-avaruuden tavoitteena on rakentaa luotettavat ja tehokkaat datamarkkinat kielivarojen jakamiseen julkisella ja yksityisellä sektorilla EU:n datastrategian mukaisesti.
Eurooppalainen kielidata-avaruus (LDS) järjestää sarjan maakohtaisia työpajoja, joiden tarkoituksena on auttaa paikallisia yrityksiä, tutkimusryhmiä ja julkishallintoja ottamaan uuden kielidatanvaihtoavaruuden käyttöönsä ja liittymään relevantteihin paikallisiin ja eurooppalaisiin verkostoihin. Samalla ne voivat hyödyntää jo olemassa olevia luotettavia infrastruktuureja. Eurooppalaisena kielidatan jakamisalustana LDS voi auttaa paikallisia toimijoita kaupallistamaan kielidataansa monikielisessä Euroopassa, jossa kieliteknologioiden ja tekoälypohjaisten sovellusten merkitys jatkuvasti kasvaa.
Suomen työpajassa käsitellään kotimaisen yksityisen ja julkisen sektorin sidosryhmien tarpeita kielidatan tarjoajina, integroijina ja/tai kuluttajina. Tapahtumassa jaetaan näiden tahojen kokemuksia ja vaatimuksia sekä selvitetään, kuinka voitaisiin päästä toivottuun teknologiseen kasvuun ja parantaa kilpailukykyä sekä kansallisella että Euroopan tasolla. Työpajassa keskustellaan siitä, kuinka LDS voi auttaa suomalaisia toimijoita ja tukea niiden pyrkimyksiä tuottaa, kaupallistaa tai hankkia kielidataa kieliteknologioiden ja tekoälypohjaisten työkalujen käyttövoimaksi Suomessa.
Työpaja on suunnattu datan haltijoille ja tarjoajille, kieliteknologioiden kehittäjille ja integraattoreille, pk-yrityksille sekä julkisen hallinnon edustajille, viranomaisille ja yhteistyökumppaneille. Työpaja on englanninkielinen.
Osallistuminen on maksutonta, mutta tilaisuuteen on ilmoittauduttava etukäteen. Ilmoittautuminen on päättynyt 03.04.2024. Ota yhteys järjestäjiin ja tarkista, onko tilaisuuteen vielä paikkoja jäljellä: lareina-office [ATT] helsinki.fi
09:00 – 09:45 |
Ilmoittautuminen |
09:55 – 10:05 |
Welcome and introduction |
10:05 – 10:35 |
Welcome by the European Commission: The Digital Europe Programme and the Common European Language Data Space |
10:35 – 11:05 |
The importance of language data for the development of LT solutions future steps |
11:05 – 11:30 |
Kahvitauko |
11:30 – 11:40 |
Welcome by the Ministry of Finance |
11:40 – 12:30 |
Language Data and Language Technologies in Finland and for Finnish |
12:30 – 13:00 |
European Language Data Space: developing a market for language data and services and benefitting from a joint European effort |
13:00 – 13:50 |
Lounas |
13:50 – 14:50 |
Language data production, management, and market development: overcoming obstacles – Panel session |
14:50 – 15:05 |
Conclusions |
15:05 – 15:15 |
Kahvitauko ja verkostoituminen |
15:15 – 16:15 |
Kahvitauko ja verkostoituminen jatkuvat Sitran järjestämässä Nordic Data Festival 2024 -tapahtumassa (rinnakkaistapahtumana Clarion Hotel Helsingissä) |
Krister Lindén and Wilhelmina Dyster
Helsingin yliopisto
lareina-office [ATT] helsinki.fi
Viimeksi päivitetty: 05.04.2024
Kurssit ovat englanninkielisiä.
This is what everyone should know about our computing environment when launching jobs!
Are you planning on using CSC’s high-performance computing (HPC) services (Puhti, Mahti, Allas…) in the near future? Have you been using these services already, but would like to make sure you are getting the most out of them? This intensive course is intended for you!
More info and registration at: https://ssl.eventilla.com/part1april24
How to handle large datasets, install own software and scale up workflows efficiently in CSC’s computing environment
Are you using CSC’s high-performance computing (HPC) services (Puhti, Mahti, Allas…), but want to make sure you are getting the most out of them? Are you working with data in the most efficient way? Want to know the best tips and tricks of the trade when scaling up your workflows? This intensive course is intended for you!
More info and registration at: https://ssl.eventilla.com/part2may24
These 2+2 half-day sessions focus on using the CSC HPC environment via short lectures and hands on tutorials. Please check the required course prerequisites.
Please note, that the same course is also available as a free self-learning online course at https://ssl.eventilla.com/csccompenvselflearn.
Organisation:
European Language Data Space
Department of Digital Humanities, University of Helsinki
The European Language Data Space and the University of Helsinki are bringing together experts from the Finnish Industry, Public Administration and Research to discuss the importance of language data for the development of Language Technologies and AI-based tools in Finland. The event is taking place on 10.04.2024 at Clarion Hotel Helsinki.
Since early 2023, the European Commission is providing guidance and support towards a new dimension in language data sharing that is executed through the European Language Data Space (LDS). This new dimension goes beyond language data and addresses many areas and fields through their specific Data Spaces. With the establishment of the Common European Data Spaces, the communication and exchange amongst different modalities of data description and availability is becoming a reality for all European countries.
In this context, the European Language Data Space aims at building a trustworthy and effective data market for the exchange of language resources in the public and – even more importantly – in the private sector, in line with the EU Data Strategy.
For that purpose, the European Language Data Space (LDS) is going to organise a series of Country Workshops to support local industries, research groups and public administrations to integrate this new language data exchange space and connect with relevant local and European networks, while benefiting from the trustworthy infrastructures already available. As European language data sharing platform, the LDS can help local industry stakeholders to monetise their language data in a multilingual Europe where Language Technologies and AI-based applications play an increasingly important role.
The Finnish LDS workshop will address the needs of the Finnish stakeholders from both private and public sectors, be it providers, integrators and/or consumers of language data, while sharing their experiences and requirements and exploring how to meet the desired technological growth to enhance their competitiveness at both national and European levels. The LDS will present and discuss how it can help the Finnish stakeholders and support their efforts to produce/monetise/obtain language data to power LT and AI-based tools in Finland.
The workshop is addressed to data owners and data providers, LT developers and integrators and SMEs, as well as to public administration executives, officers and partners. The workshop will be held in English.
Participation is free of charge, but registration is required. Registration was closed on 03.04.2024. Please contact the organisers and check if there still are seats available: lareina-office [ATT] helsinki.fi
09:00 – 09:45 |
Registration |
09:55 – 10:05 |
Welcome and introduction |
10:05 – 10:35 |
Welcome by the European Commission: The Digital Europe Programme and the Common European Language Data Space |
10:35 – 11:05 |
The importance of language data for the development of LT solutions future steps |
11:05 – 11:30 |
Coffee Break |
11:30 – 11:40 |
Welcome by the Ministry of Finance |
11:40 – 12:30 |
Language Data and Language Technologies in Finland and for Finnish |
12:30 – 13:00 |
European Language Data Space: developing a market for language data and services and benefitting from a joint European effort |
13:00 – 13:50 |
Lunch Break |
13:50 – 14:50 |
Language data production, management, and market development: overcoming obstacles – Panel session |
14:50 – 15:05 |
Conclusions |
15:05 – 15:15 |
Coffee Break and Networking |
15:15 – 16:15 |
Coffee Break and Networking continue in Sitra’s Nordic Data Festival 2024 event (co-located in Clarion Hotel Helsinki) |
Krister Lindén and Wilhelmina Dyster
University of Helsinki
lareina-office [ATT] helsinki.fi
Last updated: April 5, 2024
Vuoden 2024 ParlaCLARIN-työpaja järjestetään toukokuussa Torinossa, Italiassa osana LREC-COLING 2024 -konferenssia (Joint International Conference on Computational Linguistics, Language Resources and Evaluation).
Esitelmäkutsu on avoinna 19.2.2024 saakka. Lue lisää: https://www.clarin.eu/ParlaCLARIN-IV
11.00-11.10 Welcoming Words by Sanna Kumpulainen, Associate Professor in Information Studies, Tampere University
11.10-12.00 Keynote I on Studying SSH Research Needs: Elina Late, Senior Research Fellow in Information Studies, Tampere University
12.00-13.00 Lunch
13.00-13.45 Keynote II on Language Models: Sampo Pyysalo, Associate Professor at the Department of Computing, University of Turku
>>Download the slides of the work package presentations<< (pdf)
13.45-14.30 Work Package Presentations I
13.45-14.00 WP1.3 Veronika Laippala: Noise-Tolerant NLP
14.00-14.20 WP1.1, 1.2, 2.1, 2.2. & 2.3 Mietta Lennes: Kielipankki – The Language Bank of Finland
14.20-14.25 WP2.4 Harri Kettunen: Helsinki Term Bank for the Arts and Sciences
14.25-14.30 WP2.5 Jenny Tarvainen: Automated Text Tools for Learner Language
14.30-15.00 Coffee
15.00-16.00 Work Package Presentations II
15.00-15.05 WP3.1 Martin Matthiesen: Pipeline from the National Library to CSC
15.05-15.10 WP3.2 Tanja Välisalo: Named Entity Recognition for NARC Data
15.10-15.15 WP4.3 Eetu Mäkelä: Evaluation and Subsetting
15.15-15.20 W4.1 Julia Matveeva: Metadata Harmonization
15.20-15.25 WP4.4 Mikko Laitinen: Twitter
15.25-15.30 WP4.2 Eero Hyvönen: LOD
15.30-15.35 WP3.4 Raine Koskimaa: Game Streams
15.35-15.40 WP3.3 Maria Valaste: Qualitative Surveys
15.40-15.45 WP3.5 Kimmo Elo (Risto Turunen replacing): Text Networks
15.45-15.50 WP5 Sanna Kumpulainen: Evidence-based RI Development + Education & Resources
16.00-17.00 Free Chilling & Refreshments / Parallel session: Executive Board Meeting (with Zoom option)
Verkkokurssi Korpuslingvistiikka ja tilastolliset menetelmät on suunnattu kieliaineiden ja muiden aineiden opiskelijoille, jotka haluavat oppia korpusten käytön perusteet.
Kurssi on tarjolla sekä suomeksi että englanniksi ja se on avoin kaikille yliopisto-opiskelijoille Suomessa ja Suomen ulkopuolella. Kurssi alkoi maanantaina 4.9., mutta kurssialueelle on mahdollista liittyä osallistujamäärän salliessa vielä 15.9. saakka.
Lue lisää ja ilmoittaudu mukaan!
Huom. Sama kurssi järjestetään uudelleen seuraavan kerran 3. periodissa, 15.1.2024 alkaen (ks. kurssisivu).
Kansainvälinen INTERSPEECH 2023 -konferenssi järjestettiin 20.-24. elokuuta Dublinissa, Irlannissa. Mietta Lennes piti konferenssissa posteriesitelmän, joka perustui seuraavaan englanninkieliseen konferenssiartikkeliin:
Lennes, M., Toivola, M. (2023). Pitch distributions in a very large corpus of spontaneous Finnish speech. Proceedings of INTERSPEECH 2023, 4778-4782, doi: 10.21437/Interspeech.2023-1822.
Tutustu englanninkieliseen posteriin
11.00-11.10 Welcoming Words by Katri Tegel, Development Manager, CSC
11.10-12.00 Keynote: Mikko Kurimo, Professor of Speech and Language Processing, Aalto University
12.00-13.00 Lunch
13.00-15.00 Thematic Groups
15.00-15.30 Coffee
15.30-16.15 Sharing the Results from the Groups
16.15-17.00 Free Chilling & Refreshments / Parallel session: Executive Board Meeting (with Zoom option)
11.00-12.00 Jari Ojala: Welcoming words + Pasi Tyrväinen: Keynote
12.00-13.00 Lunch
13.00-13.15 Anna Sendra Toset: Results from FIN-CLARIAH interviews
13.15-14.30 Teamwork in thematic groups:
14.30-15.00 Coffee
15.00-16.00
16.00-17.00 Socializing & refreshments (Executive board meeting)
Avoin verkkokurssi Data Clinic käynnistyy 11.11.2022 ja jatkuu huhtikuun 2023 lopulle. Talven ja kevään aikana opit kirjoittamaan oman aineistonhallintasuunnitelman (Data Management Plan, DMP) ja saat käytännön tukea ja neuvontaa aineistosi keräämiseen, käsittelyyn ja hallintaan. Opiskelu tapahtuu lähtökohtaisesti etänä, osin itsenäisesti ja osin pienissä vertaisryhmissä.
Kurssimateriaalit tarjotaan pääosin englanniksi. Kaikkien yliopistojen ja tieteenalojen opiskelijat ovat sallitun opiskelijamäärän rajoissa tervetulleita. Ainoa esivaatimus on, että olet aloittamassa tutkimusta, jossa sinun pitää käsitellä ja hallita juoksevaa tekstiä ja/tai puhetallenteita sisältävää aineistoa (ts. kieliaineistoa).
Lue lisää ja tule mukaan kurssille 28.11. mennessä!
Verkkokurssilla otetaan haltuun perustyökalut puhenäytteiden litterointiin, transkribointiin ja tutkimiseen ja opitaan oman puhekorpuksen suunnittelun ja hallinnan periaatteita. Kurssin aikana käytetään aktiivisesti Praat-ohjelmaa ja tutustutaan myös ELANiin.
Kurssi on avoin kaikkien yliopistojen opiskelijoille ja sen voi suorittaa joko suomeksi tai englanniksi. Osallistujamäärää saatetaan kuitenkin tarvittaessa rajoittaa. Opettajina toimivat Mietta Lennes ja Juraj Šimko Helsingin yliopistosta.
Kurssi on alkanut, mutta mukaan ehtii liittyä vielä perjantaihin 11.11.2022 saakka.
Lisätietoa ja liittyminen Moodle-alueelle
To view or download the PDF version, click on the image.
Mietta Lennes esittelee Kielipankkia ja kertoo kieliaineistojen arkistoinnin käytänteistä Langnetin kesäkoulussa 15.8. klo 14-15.
Katso lisätiedot ja lataa esityksen diat tapahtumakalenterista!
FIN-CLARIAH-infrastruktuurihankkeen aloitustapaaminen pidetään Kansalliskirjastossa 3.6.2022. Tilaisuudessa esiteltäviä postereita voi käydä ihailemassa tapahtumasivulla.