<< List of all deliverables

DX.Y.Z: Title of Deliverable

Project: FIN-CLARIAH
Grant agreement: Academy of Finland no. 345610
Start date: 01-01-2022
Duration: 24 months

WP x.y: Report on <topic of the deliverable>
Date of reporting: dd-mm-2022

Authors: Firstname Lastname (Organization)
Contributors: Firstname Lastname (Organization)
Deliverable location: <link to, e.g., a GitHub repository, or other external location that includes further information or relevant content>

Keywords for the deliverable page: (any relevant keywords separated with semicolons; for search engines etc.)

Description

The description text (max. 3000 characters) may include the following, if applicable:

  • Links to external resources
  • Publications, if any (including DOI)
  • Events, if any (including links)

The publication-ready deliverable should be emailed as a MS Word document (or similar) to wilhelmina.dyster (ATT) helsinki.fi, Cc:krister.linden (ATT) helsinki.fi.

Deadline for deliverables due 2022-09: Send the content for your deliverable page by 1.11.2022.

FIN-CLARIAH Deliverables

<< FIN-CLARIAH Overview

This page will showcase the project deliverables in 2022-2023 (see template and instructions for reporting).

Module 1: Natural Language Processing (NLP)

W1.1 Text processing and annotation environments

D1.1.1 Updating LBF resource selection 2022-09
D1.1.2 Ingesting new unstructured resources 2023-12

W1.2 Speech processing and annotation

D1.2.1 Forced-Alignment Service 2022-09
D1.2.2 Transcription Service for Finnish Interviews 2023-09

W1.3 Noise-tolerant NLP

D1.3.1 Corpora of non-standard language 2022-09
D1.3.2 Statistical noise models 2023-06
D1.3.3 Language models 2023-09
D1.3.4 Noise-resistant models 2023-12

Module 2: Language Research Infrastructure

W2.1 Social Data Science

D2.1.1 Licensing agreements for personal data 2022-09
D2.1.2 Licensing agreements for special categories 2023-06

W2.2 Learners’ Assessment Environments

D2.2.1 Speech recognition for L2 2022-12
D2.2.2 Speech recognition for L2 update 2023-12

W2.3 Translation and Interpretation

D2.3.1 Licensing interpretation sessions 2022-12
D2.3.2 Aligning and retrieving interpretations 2023-12

W2.4 Terminology

D2.4.1 Term discovery procedures 2022-09
D2.4.2 Terminology application 2023-06
D2.4.3 Initializing terminology collections 2022-09

W2.5 Solutions for better use of language learner performances in research

D2.5.1 Test performances storage 2022-12
D2.5.2 Learner performances tools 2023-12

Module 3: Structuring Data

W3.1 Increasingly automated ingestion of material

D3.1.1 Initial NLF data 2022-09
D3.1.2 Ingestion framework 2022-12
D3.1.3 Versioning support 2023-06
D3.1.4 Incremental update process 2023-12

W3.2 AI solutions to better use of National Archives mass digitisation services

D3.2.1 Analysis tools for NARC data 2022-12
D3.2.2 Annotation tools for NARC data 2023-12

W3.3 AI solutions to better use of textual qualitative survey data

D3.3.1 Qualitative survey data concept network 2022-09
D3.3.2 Browser for data concept network 2023-09

W3.4 Developing analysis methods for real-time chats in gameplay streams

D3.4.1 Audio-visual and textual interaction analysis 2022-12

W3.5 Developing analysis methods for text network analysis of political texts

D3.5.1 TNA-based analysis of text 2022-12
D3.5.2 TNA network of Parliamentary debates 2023-09

Module 4: Analyzing Structured Data

W4.1 Metadata harmonization and analysis

D4.1.1 Harmonized FNB 2022-09
D4.1.2 Harmonization code 2022-12
D4.1.3 Visualisation workflow 2023-06
D4.1.4 R/Python modules 2023-12

W4.2 Linked Open Data Services

D4.2.1 LDF knowledge extraction tools 2022-12
D4.2.2 Parliament of Finland ontology 2023-12

W4.3 Subsetting data

D4.3.1 Subsetting tool 2022-09
D4.3.2 Statistical overviews and bias detection 2023-06
D4.3.3 Intelligent noise reduction 2023-12

Module 5: Information Interaction

W5.1 Evidence-based RI development

D5.1.1 User experience questionnaire 2022-09
D5.1.2 Log data collection and analysis 2023-06
D5.1.3 Protocol for collecting workshop data 2023-12

W5.2 Education and dissemination

D5.2.1 Actor network 2022-12
D5.2.2 Educational material 2023-12

Top of page

<< FIN-CLARIAH Overview

Repackaging of the downloadable version of the Corpus of Finnish Sign Language: elicited narratives (CFinSL-elicit-dl)

The Corpus of Finnish Sign Language (CFinSL) has been available via the download service of the Language Bank of Finland after the former LAT platform was discontinued. The original downloadable packages turned out to be too large in order to be frequently downloaded and used during courses, for example. To alleviate the situation, the subcorpus of elicited narratives (CFinSL-elicit) was reorganized into smaller packages. Each package now includes the files of a given session, i.e., the video recordings and annotation files of a specific narration task performed by a specific signer.

For the time being, the download packages of the related conversation subcorpus (CFinSL-conv) were not modified. The access locations and content of both subcorpora remain the same.

More information about the currently available versions of the corpus can be found on the resource group page.

Suomalaisen viittomakielen korpuksen kerronta-aineiston ladattava versio (CFinSL-elicit-dl) paketoitiin uudelleen

Suomalaisen viittomakielen korpuksen (CFinSL) sisältö on ollut ladattavissa Kielipankin latauspalvelun kautta sen jälkeen, kun LAT-alusta poistui käytöstä. Alkuperäiset latauspaketit ovat kuitenkin osoittautuneet opetuskäytössä liian suuriksi, koska tiettyjä aineiston osia on välttämätöntä ladata usein kurssien yhteydessä. Tilanteen helpottamiseksi korpuksen kerronta-aineisto (CFinSL-elicit) on nyt paketoitu uudelleen hieman pienempiin osiin siten, että yksittäinen latauspaketti sisältää vain yhden istunnon tiedostot (ts. yhden viittojan tiettyyn kerrontatehtävään liittyvät videotallenteet ja annotaatiotiedostot).

Samaan korpuskokonaisuuteen kuuluvan keskusteluaineiston (CFinSL-conv) latauspaketit ovat toistaiseksi ennallaan. Kummankaan osa-aineiston sijainti tai sisältö ei ole muuttunut.

Lisätietoa Suomalaisen viittomakielen korpuksen saatavilla olevista versioista löytyy CFinSLaineistoryhmän sivulta.

Stay tuned for the long-awaited Korp update in December 2021!

Korp – our favourite corpus query service – will finally be upgraded to a new version before Christmas! You may already test the new Korp at https://korp.csc.fi/korplab/#?lang=en.

In the corpus menu of the new Korp version, the existing corpora have been rearranged under thematic sections. The same content is still available. In case you have links to corpus queries performed in the previous Korp version, they should continue to work in the new Korp version after the upgrade.

In addition, the new Korp version includes some features that have not been previously available, such as an improved way of filtering the content where the search is to be performed, and a better map feature for corpora that include information on geographic locations. All features will not be immediately available in the new Korp version, but they will be added little by little.

Please report any deficiencies either via the feedback form that you can find under the wheel menu in Korp, or by email to fin-clarin (at) helsinki.fi. For the time being, the current Korp version will remain available even after the upgrade at https://korp.csc.fi/korp-old/#?lang=en.

Korp instructions

Ennakkotietoa Korp-palvelun päivityksestä joulukuussa 2021

Suosikkihakupalvelumme Korp päivittyy uuteen versioon vielä ennen joulua! Uutta Korp-versiota voi jo kokeilla osoitteessa

https://korp.csc.fi/korplab/

Uutta Korp-versiota varten Korpin korpusvalikossa näkyvät aineistot on järjestetty uudelleen aihepiirin mukaan. Korpusten sisällöt ovat kuitenkin samoja, ja aiemmalla Korp-versiolla tehtyjen hakulinkkien pitäisi toimia suoraan myös uudella Korpilla.

Uusi Korp mahdollistaa joitakin sellaisia ominaisuuksia, joita aikaisemmassa versiossa ei ole ollut käytettävissä, esimerkiksi mahdollisuuden suodattaa hakujen kohteena olevaa aineistoa sekä paremman karttanäkymän niille korpuksille, joihin on liitetty sijaintitietoja. Kaikki ominaisuudet eivät välttämättä ole heti käytettävissä uudessa Korp-versiossa, mutta niitä lisätään ajan myötä.

Toivomme palautetta uuden Korpin puutteista joko Korpin ratasvalikosta löytyvän palautelomakkeen kautta tai sähköpostitse osoitteella fin-clarin (ät) helsinki.fi. Päivityksen jälkeen myös nykyinen Korp-versio jää toistaiseksi käyttöön osoitteessa https://korp.csc.fi/korp-old/.

Korp-palvelun käyttöohjeet

Lahjoita puhetta-kampanjan ruotsinkielinen versio Donera prat on käynnistynyt

Lahjoita puhetta-kampanjan ruotsinkielinen versio Donera prat (svenska.yle.fi/doneraprat) on alkanut verkossa. Kaikki ruotsin kieltä silloin tällöin arjessa käyttävät ovat tervetulleita lahjoittamaan näytteensä, jotta tekoäly ymmärtäisi tulevaisuudessa myös suomenruotsia.

Tervetuloa lahjoittamaan osoitteessa https://doneraprat.fi!

Donera prat logo

The Swedish version of the Donate Speech campaign has started online

The Swedish version of the Donate Speech campaign (svenska.yle.fi/doneraprat) has started online (https://doneraprat.fi). Everyone who once in a while uses Swedish in Finland is welcome to donate their speech samples so that in the future, artificial intelligence will also understand Swedish the way it is spoken in Finland.

Donera prat logo

Kampanjen Donera prat har börjat

Kampanjen Donera prat (svenska.yle.fi/doneraprat) har börjat på nätet (https://doneraprat.fi). Alla som då och då använder svenska i vardagen är välkomna att donera lite vardagsprat för att utveckla artificiell intelligens som i framtiden även förstår finlandssvenska.

Donera prat logo

Lahjoita puhetta -kampanja palkittiin PRIX EUROPAlla: Vuoden 2021 paras eurooppalainen digitaalinen audioprojekti

Lahjoita puhetta -kampanja, jonka suunnittelussa Kielipankki on ollut mukana, palkittiin vuoden 2021 Prix Europa-festivaalilla sarjassa Best European Digital Audio Project of the Year 2021. Voittajat julkistettiin Saksan Potsdamissa 15.10.2021. Lue Ylen sivuilta lisää Prix Europa -palkinnosta: https://yle.fi/aihe/a/20-10001451

Aiemmin tänä vuonna Lahjoita puhetta on voittanut parhaan mobiilipalvelun palkinnon sekä kunniamaininnan parhaasta datan käytöstä digitaalisen median Grand One -gaalassa (linkki Ylen sivuille).

Lahjoita puhetta on Ylen, Valtion kehitysyhtiö Vaken (nykyinen Ilmastorahasto), Solitan, Aalto-yliopiston ja Helsingin yliopiston yhteinen hanke.

 

Tästä voit lahjoittaa puhettasi!

Donate Speech awarded with Prix Europa: Best European Digital Audio Project of the Year 2021

The Donate Speech campaign, where the Language Bank of Finland has been involved, was awarded with PRIX EUROPA: Best European Digital Audio Project of the Year 2021 (see https://www.prixeuropa.eu/news/2021/10/15winners-y4emh). The award ceremony took place in Potsdam, Germany on 15th October, 2021.

Earlier this year, Donate Speech also won the national Grand One award for Best Mobile Service of the Year, including a distinction for Best Use of Data.

Donate Speech is a joint project of Yle – the Finnish Broadcasting Company, Vake Oy (current Ilmastorahasto), Solita, Aalto University and the University of Helsinki.

 

If you speak and understand Finnish, you can donate your speech here!

University of Helsinki Open Science Award 2021 was granted to the Language Bank of Finland and the Donate Speech campaign

On 29th October 2021, the Language Bank of Finland and the Donate Speech campaign (Lahjoita puhetta) were awarded by the University of Helsinki in recognition of exceptional work in promoting the accessibility and reusability of research data. In addition to the Language Bank, the award was given to Research Coordinator Kati Lassila-Perini.

In the award ceremony, Research Director Krister Lindén gave a presentation that is now available on YouTube with English subtitles. Read more about the award on the website of the University of Helsinki.

Helsingin yliopiston avoimen tieteen palkinto 2021 myönnettiin Kielipankille ja Lahjoita puhetta -kampanjalle

Helsingin yliopisto myönsi 29.10.2021 Kielipankille ja Lahjoita puhetta -kampanjalle avoimen tieteen palkinnon tunnustuksena tutkimusaineistojen avaamisen ja uudelleenkäytettävyyden edistämisestä. Kielipankin lisäksi palkinnon sai tutkimuskoordinaattori Kati Lassila-Perini.

Lokakuun lopussa pidetyssä palkintoseremoniassa tutkimusjohtaja Krister Lindén piti esityksen, joka on nyt saatavilla YouTubessa englanniksi tekstitettynä. Lisätietoa palkinnosta löytyy Helsingin yliopiston verkkosivuilta.

Teachers from Finland, Slovenia and the United Kingdom awarded by CLARIN

In 2021, the Teaching with CLARIN Award was given to three projects: Darja Fišer and Kristina Pahor de Maiti from Slovenia and Mietta Lennes from Finland (and from the Language Bank of Finland!) won the The Teaching with CLARIN Jury Award, and Diana Maynard from the UK won The Teaching with CLARIN Audience Award. The winners were published in the CLARIN Annual Conference on 28th October, 2021.

The award is intended for lecturers or other education professionals who have successfully integrated CLARIN into the courses they teach and/or training material they have developed. The next call is to be opened in 2022.

Check out all the submitted contributions at https://www.clarin.eu/content/teaching-clarin.

 

Etsimme yhteistyökumppaneita Lahjoita puhetta -kampanjassa kerätyn puheaineiston litterointiin

Yleishyödyllisen Lahjoita puhetta -kampanjan kautta olemme saaneet kerättyä suomenkielistä arkipuhetta eri puolilta Suomea jo 3500 tunnin verran. Tätä puheaineistoa tullaan hyödyntämään tekoälyn tutkimuksessa ja kehityksessä sekä kielentutkimuksessa. Tavoitteena on myös tuottaa tulevaisuudessa ratkaisuja ja palveluita, kuten ääniohjattuja laitteita, jotka ymmärtävät erilaisia suomen murteita ja puhetapoja.

Lahjoita puhetta -kampanjan kautta kerätty puheaineisto on siis varsin laaja. Nyt etsimmekin yhteistyökumppaneita kampanjassa lahjoitettujen puheäänitteiden litterointia varten.

Litterointipalveluiden toimittajien valitsemiseksi olemme avanneet tarjouspyynnön Hanki-tarjouspalveluun. Tarjouksen voi jättää palvelun kautta 15.3.2021 klo 14.00 saakka.

Jätä tarjous tästä: https://hanki.tarjouspalvelu.fi/hanki?id=333409&tpk=faf82783-69d2-43cb-be60-bca036eed47f

 

PS. Vielä ehdit itsekin lahjoittaa puhetta!

Tietoarkisto julkaisi uudistetun Tutkimusmenetelmien verkkokäsikirjan opiskeluun ja opetukseen

Tietoarkiston uusi Tutkimusmenetelmien verkkokäsikirja koostuu kahdesta osasta, Kvantitatiivisen tutkimuksen verkkokäsikirjasta ja Laadullisen tutkimuksen verkkokäsikirjasta. Käsikirjat on suunnattu etenkin yhteiskuntatieteellisten aineiden opiskelijoille, mutta niistä on hyötyä monille muillekin.

Materiaaleja voi käyttää vapaasti opiskelussa ja opetuksessa. Tietoarkisto toivoo kuitenkin opettajilta käyttöilmoitusta. Kurssien opetustilanteiden ulkopuolisesta yksittäiskäytöstä informointi on myös toivottavaa, mutta ei pakollista.

Tutkimusmenetelmien verkkokäsikirja pohjautuu suosittuun Menetelmäopetuksen tietovarantoon (MOTV). Myös MOTV on edelleen saatavilla, mutta sitä ei enää aktiivisesti päivitetä.

 

Myös Kielipankki esitellään uudessa Laadullisen tutkimuksen verkkokäsikirjassa:

 

 

 

LAT service to be discontinued in November 2020

Suomeksi

For technical reasons, the LAT service (lat.csc.fi) will be discontinued in the Language Bank of Finland as of November 30, 2020.

The LAT platform itself is no longer developed in its present form by MPI, and the media browser component Annex (part of LAT) is based on deprecated Adobe Flash technology that will stop working at the end of this year.

What will happen to the corpora that used to be available in LAT?

A replacement service for LAT has not yet been selected by the Language Bank of Finland. However, all the speech and sign language corpora that were previously available in LAT will be made available by alternative means.

All of the LAT corpora can be offered as downloadable packages that can be used and studied directly on the user’s local computer. In the download service, the corpora can be accessed under the same conditions as via LAT. For some corpora, more advanced solutions might already be available.

Which corpora are affected by LAT shutting down?

The LAT instances of the following corpora will be affected:

  • aku-egg: Speech and EGG (Electroglottography) Simultaneous Recordings
  • cfinsl-conv: Corpus of Finnish Sign Language: conversations
  • cfinsl-elicit: Corpus of Finnish Sign Language: elicited narratives
  • eduskunta-v1-lat: Plenary Sessions of the Parliament of Finland, Kielipankki LAT Version 1
  • elfa-lat: The Helsinki LAT Version of the ELFA Corpus
  • fbc-lat: The Helsinki LAT Version of the Finnish Broadcast Corpus
  • ffe: a single unpublished video file by an unknown creator, access restricted to the owner (this data will be archived temporarily but will be removed quite soon unless the owner turns up!)
  • finka: The Corpus of Border Karelia, Kielipankki LAT version
  • giellagas-north: Samples of Northern Saami
  • helpuhe1: The Longitudinal Corpus of Finnish Spoken in Helsinki (1970s, 1990s and 2010s)
  • kipo: The 2010 Language Policy Program of the Sign Languages of Finland Corpus (versions 1 and 2)
  • la-murre: The Finnish Dialect Syntax Archive’s Helsinki LAT Version
  • PeWi-corpus (the original authoritative copy is offered by MPI; the identical version will be removed from the Language Bank of Finland)
  • puheen-analyysi: Learning material for speech analysis
  • reittidemo-lat: The Helsinki LAT Version of the Route to A wing Corpus
  • seuruu: Follow-up Study of Dialects of Finnish
  • skn-lat: The Helsinki LAT Version of Samples of Spoken Finnish
  • snowfrog: ProGram data. The stories Snowman and Frog, where are you?
  • ssdc-2016: Skolt Saami Documentation Corpus (2016)

In order to see where each corpus will be located in the future, please refer to the corresponding metadata page where this information will be updated. The relevant metadata links are provided on the list above.

I came to this page via a PID, how do I know where the file is?

LAT assigned 25000 PIDs to individual files. We have no automatic mapping of these PIDs but we can help you find the file if you need it. We aimed to structure downloadable packages similar to the dataset structure on LAT. To locate a file look into the URL field of this page where you find a ”?path=...” parameter. Example: ?path=demo/TRASH/2017-01/526/v7556__.C_4.4_Viittomakielisten_kielelliset_oikeudet.imdi

This should help you locate your file, please contact us if you have any questions.

Schedule

August-September 2020:

  • The (numerous) persistent identifiers assigned by LAT to individual files will be redirected to stopover/tombstone pages. There will be one tombstone page per dataset.
  • The LAT corpora that are not yet offered in Download will be moved there and their persistent identifiers will be updated to point to their new home.
  • Assuming that too many errors are not detected, this process should be complete by October.

September-October 2020:

  • Decisions are to be taken as to what kind of streaming services the Language Bank can implement for audio and video materials in the year 2021.

30th November 2020:

  • The support for the server where LAT is located will be discontinued and the service will be shut down.
  • All the corpora that were previously offered via LAT will continue to be offered at least for download.

Year 2021 (and later):

  • Given that there are sufficient resources, more functionalities for browsing, searching, and analyzing speech and sign language corpora can be added.

Further details on the schedule of the aforementioned process will be updated on this page. In case you need additional information at this point, please contact FIN-CLARIN directly.

LAT-alusta poistuu käytöstä

In English

Teknisistä syistä Kielipankin käytössä ollut LAT-palvelu (lat.csc.fi) joudutaan sulkemaan marraskuun lopussa 2020.

MPI ei enää kehitä LAT-alustaa nykyisessä muodossaan, ja LATiin kuuluva Annex-mediaselaintyökalu perustuu Adoben vanhentuneeseen Flash-teknologiaan, joka lakkaa toimimasta vuoden lopussa.

Mitä tapahtuu korpuksille, jotka ovat olleet LATin kautta saatavilla?

Kielipankin käyttämälle LAT-palvelulle ei vielä ole valittu täysin korvaavaa palvelua. Kaikki puheaineistot ja viittomakielten aineistot, jotka ovat aiemmin olleet käytettävissä LATin kautta, tuodaan saataville toisella tavalla.

Kaikki LATissa olleet aineistot voidaan tarjota ladattavina paketteina, joita voi käyttää suoraan omalla koneella. Latauspalvelun kautta korpuksiin pääsee samoilla ehdoilla kuin aiemmin LATin kautta. Joillekin aineistoille voidaan jo nyt tarjota edistyneempiäkin ratkaisuja tavanomaisen latauspalvelun lisäksi.

Mihin korpuksiin LAT-palvelun sulkeminen vaikuttaa?

Muutokset koskevat seuraavien korpusten LAT-versioita:

  • aku-egg: Puheen ja EGG:n samanaikaiset tallenteet
  • cfinsl-conv: Suomalaisen viittomakielen korpus: keskusteluaineisto
  • cfinsl-elicit: Suomalaisen viittomakielen korpus: kerronta-aineisto
  • eduskunta-v1-lat: Eduskunnan täysistunnot, Kielipankin LAT-versio 1
  • elfa-lat: ELFA-korpuksen Helsinki-LAT-versio
  • fbc-lat: Suomalaisen radio- ja tv-korpuksen Helsinki-LAT-versio
  • ffe: yksittäinen, virallisesti julkaisematon tiedosto, jonka omistaja ei ole tiedossa ja pääsy on rajoitettu vain omistajalle (sisältö tullaan säilyttämään tilapäisesti mutta poistetaan, ellei omistaja ilmoittaudu!)
  • finka: Raja-Karjalan korpus, Kielipankin LAT-versio
  • giellagas-north: Pohjoissaamen näytekorpus
  • helpuhe1: Helsingin puhekielen pitkittäiskorpus (1970, 1990, 2010)
  • kipo: Kipo-korpus (Suomen viittomakielten kielipoliittinen ohjelma 2010) (versiot 1 ja 2)
  • la-murre: Lauseopin arkiston murrekorpuksen Helsinki-LAT-versio
  • PeWi-corpus: Kyseisen näyteaineiston alkuperäisen virallisen kopion tarjoaa MPI, joten identtinen versio tullaan poistamaan Kielipankista
  • puheen-analyysi: Puheen analyysin oppimateriaali
  • reittidemo-lat: Reitti A-siipeen -korpuksen Helsinki-LAT-versio
  • seuruu: Murteenseuruukorpus
  • skn-lat: Suomen kielen näytteitä -korpuksen Helsinki-LAT-versio
  • snowfrog: ProGram-aineisto, lumiukko- ja sammakkotarinat
  • ssdc-2016: Koltansaamen dokumentaatiokorpus (2016)

Kunkin aineiston kuvailutietosivulta löydät päivitetyt tiedot kyseisen aineistoversion tulevasta sijainnista. Linkit kuvailutietueisiin näkyvät yllä olevasta listasta.

Aikataulu

Elo-syyskuu 2020:

  • LAT-alustan automaattisesti tuottamat (lukuisat) pysyvät tunnisteet, jotka osoittavat aineistojen sisällä oleviin yksittäisiin tiedostoihin, tullaan ohjaamaan uudelleen laskeutumis- tai ”hautakivisivuille”. Jokaiselle korpukselle tehdään yksi tällainen laskeutumissivu.
  • Ne LAT-aineistot, jotka eivät aikaisemmin ole olleet tarjolla ladattavina versioina, tullaan siirtämään latauspalveluun. LAT-versioiden pysyvät tunnisteet päivitetään osoittamaan ko. aineistojen uuteen kotiin.
  • Ellei em. prosesssin aikana ilmene odottamattomia virhetilanteita, kaikkien aineistojen pitäisi olla siirrettyinä ja tunnisteiden päivitettyinä lokakuun loppuun mennessä.

Syys-lokakuu 2020:

  • Kielipankki tekee tarvittavat selvitykset ja päätökset siitä, millaisia striimaus- ja muita lisäpalveluita Kielipankissa on mahdollista toteuttaa ääni- ja videoaineistoille vuoden 2021 aikana.

30. marraskuuta 2020:

  • LAT-palvelimen tuki päättyy ja palvelu ajetaan alas.
  • Kaikki LATissa aiemmin tarjolla olleet aineistot tullaan jatkossakin tarjoamaan vähintään ladattavina versioina.

Vuosi 2021 (ja myöhemmin):

  • Resurssien puitteissa Kielipankkiin voidaan lisätä uusia palveluita ja toiminnallisuuksia puheaineistojen ja viittomakielten aineistojen selailuun, hakujen tekemiseen ja analysointiin.

Edellä mainitun prosessin tarkemmat yksityiskohdat päivitetään tälle sivulle. Mikäli tarvitset tässä vaiheessa lisätietoja, ole hyvä ja ota suoraan yhteyttä FIN-CLARINiin.

Ilmoittaudu nyt uuteen Kielipankki Live -verkkotapahtumaan!

Kielipankki Live on uusi verkkotapahtumien sarja, jossa haastatellaan tutkijoita ja keskustellaan ajankohtaisista Kielipankkiin liittyvistä aiheista. Tapahtumat videoidaan ja tallenteet ovat katsottavissa jälkikäteen tällä sivulla, myöhemmin myös tekstitettyinä.

Ensimmäinen Kielipankki Live -tilaisuus järjestetään maanantaina 24.8. klo 13.00 alkaen. Ilmoittautumalla jo ennakkoon varmistat itsellesi Zoom-kutsulinkin ja saat myös tilaisuuden jälkeen tiedon, kun videotallenne on katsottavissa.

Ilmoittautuminen ja lisätiedot: https://www.kielipankki.fi/kielipankki-live/

The Donate Speech (Lahjoita puhetta) campaign kicks off 16.6.2020

The Language Bank of Finland is working together with the Finnish Broadcasting Company (Yle) and the Finnish State Development Company (Vake Oy) in the Donate Speech campaign (Lahjoita puhetta) launching on 16th June 2020. The aim of this project is to collect all kinds of Finnish speech from all kinds of people, from all over Finland and abroad.

By donating your speech, you can help researchers and companies to study language and to develop technology and services that can be used in Finnish more fluently in the future. All variants of spoken Finnish are welcome – including the speech of second-language Finnish learners. As long as you speak some Finnish and can understand the Finnish instructions in the app, you can donate!

Read more about the contribution of the Language Bank of Finland (in Finnish)

Go and donate your speech!

See also:

Interview of Mietta Lennes in the morning radio program Puheen Aamu on Yle Puhe 16.6.2020 (the program is available in Finnish for one week after time of broadcast)