22.12.2025
Kielipankin uutiskirje 2/2025
In English
Kuukauden tutkijat vuonna 2025
- Tamás Grósz – automaattinen puheentunnistus (ASR)
- Marko Jouste – Giellagas-instituutin puhuttujen saamen kielten korpus
- Simo Määttä – kääntäminen, tulkkaus ja kriittinen sosiolingvistiikka
- Pekka Posio – iberoromaaniset kielet, CoLaGe-aineisto
- Daniela Piipponen – språkhistoria, Digisvenska-projektet
- Jörg Tiedemann – kieliteknologia, OPUS-ekosysteemi
- Rea Peltola – elollisuuden semantiikka
- Idastiina Valtasalmi – kielellinen affekti, selkokieli
- Inka Rantakallio – suomalaiset räppäävät nais- ja muunsukupuoliset artistit
- Dejan Porjazovski – automaattinen puhutun kielen ymmärtäminen (SLU)
- Krista Ojutkangas – aineistopohjainen suomen kielen tutkimus
- Satu Siltaloppi – suomenruotsalainen viittomakieli
Myös aikaisemmat tutkijaesittelyt löytyvät arkistosta.
Tiedätkö tutkijoita, joka käyttävät Kielipankkia ja sopisivat kuukauden tutkijoiksi? Olisitko ehkä itse yksi heistä? Ehdota meille: https://www.kielipankki.fi/tuki/ota-yhteytta/
Uusia, päivitettyjä ja laajennettuja aineistoja vuonna 2025
- Jäsennetty skotinkielinen kirjekorpus, lähdemateriaali
- Achemenetin babylonialaiset tekstit – Kielipankin versio 2020-12, Korp
- BALT: Babylonian Administrative and Legal Texts – Kielipankin versio 2025-02, Korp
- Suomi24-aineiston laajennus vuosilta 2021–2023 sekä täydennetty versio vuosilta 2001-2020 Korpissa
- Laajennettu ja päivitetty aineistokokoelma Suomi24 2001–2023 VRT-muodossa Kielipankin latauspalvelussa
- Uusbabylonialaiset sanaverkostot ja taustalla oleva tietoaineisto
- ORACC 2024 – Open Richly Annotated Cuneiform Corpus, Korp-versio, marraskuu 2024
- Donera Prat -aineisto, tutkimuskäyttöön
- Suomalaisen viittomakielen korpus, osa 3 (cfinsl-p3; julkaisuehdokas)
- Suomenruotsalaisen viittomakielen korpus: keskusteluaineisto, osa 2
- Ylen suomenkielinen uutisarkisto 2022-2024, lähdemateriaali
- Bishkekin kielellinen maisema, lähdemateriaali
- Korpus kielen ja sukupuolen tutkimiseen Meksikossa ja Espanjassa (CoLaGe), lähdemateriaali ja tekstiversio
- Satakuntalaisuus puheessa -korpus, lähdemateriaali
- Murteita käsittelevien fennististen väitöskirjojen lähdetietokanta, avoin versio, lähdeaineisto
- Feministiset räppäävät naiset ja muunsukupuoliset Suomessa, lähdemateriaali
- Ylen suomenkielinen uutisarkisto 2022–2024 (julkaisuehdokas)
Haluatko tarjota omaa aineistoasi Kielipankin välitettäväksi?
Ilmoita oman uuden aineistosi perustiedot Kielipankille: http://urn.fi/urn:nbn:fi:lb-2021121421
Kielipankin korpuksia nyt myös Federated Content Search -palvelussa
Kielipankki on liitetty CLARINin yhdistettyyn sisältöhakuun (Federated Content Search, FCS). FCS:n kautta voi tehdä yhdenmukaisia hakuja eri maissa olevien CLARIN-keskusten tekstikorpuksista. Hakuun on tässä vaiheessa kytketty Kansalliskirjaston sanoma- ja aikakauslehtikokoelman suomenkielinen ja ruotsinkielinen osakorpus sekä uusin Suomi24-korpus. Kokeile yhdistettyä hakua
Tulevia uudistuksia: Korp ja Mink
- Korp-palveluun on tekeillä laaja päivitys, jonka beetaversio tulee saataville keväällä 2026. Uudistuksen päätavoitteena on, että suomalaisen Kielipankin Korp-versio voidaan jatkossa pitää johdonmukaisesti ajan tasalla ruotsalaisen Språkbankenin kehittämän ja tarjoaman Korp-version kanssa. Huomaathan, että kaikkia korpuksia ja niiden kaikkia ominaisuuksia ei ole mahdollista saada heti käyttöön uudella Korp-alustalla. Siirtymävaiheen aikana uusi beetaversio ja vanha Korp-versio tulevat olemaan käytettävissä rinnakkain. Tarkemmat tiedot uudistuksesta ja sen aikataulusta päivitetään Kielipankin verkkosivuille.
- Mink-alusta on myös tulossa Kielipankin käyttäjien saataville keväällä 2026. Mink-ympäristöön kirjaudutaan oman yliopiston tunnuksella. Sinne voi ladata omia tekstejä, jäsentää ja annotoida niitä tarpeen mukaan automaattisilla työkaluilla sekä tehdä lopputuloksena syntyvästä yksityiskorpuksesta hakuja omassa Korpissa. Lue Minkistä lisää Språkbankenin sivuilta (englanniksi tai ruotsiksi).
Tapahtumia vuonna 2025
- Kesäkuussa pidettyyn The Origins of Emesal -työpajaan osallistui yhteensä noin 50 assyriologia joko paikan päällä Helsingissä tai etänä. Kielipankin kautta on saatavilla useita ANEE-huippuyksikön tuottamia aineistoja: Achemenet, BALT, ORACC ja ANEE Lexical Portal.
- Marraskuussa järjestetty LAREINA-työpaja Accessing Data for Large Language-based Text and Speech Models keräsi Helsinkiin asiantuntijoita yrityksistä, yliopistomaailmasta ja julkishallinnosta. Työpajassa käsiteltiin aineistojen saatavuuteen ja oikeudellisiin ehtoihin liittyviä kysymyksiä ja esiteltiin kieliteknologisia ratkaisuja, joita on rakennettu esimerkiksi yhteistyössä kielivähemmistöjen kanssa, arkistoja hyödyntämällä tai julkisen sektorin palvelutarpeiden pohjalta.
- Marraskuussa järjestettiin Helsingin yliopistossa myös FIN-CLARIAH-kokous Annotating Social Data, jossa pohdittiin aineistojen annotointikäytänteitä ihmistieteellisillä aloilla, arkaluonteisten aineistojen käsittelymahdollisuuksia sekä AI-työkalujen vastuullista käyttöä annotointityön osana.
Kielipankki toimii Language Data Space Connector -ohjelmiston beetatestaajana
European Language Data Space (LDS; Eurooppalainen kielidata-avaruus) -hankkeen tavoitteena on rakentaa datamarkkinat, joiden kautta sekä julkisen että yksityisen sektorin toimijat voivat vaihtaa kieliaineistoja EU:n datastrategian mukaisesti. Kielipankki osallistuu LDS-hankkeessa kehitettävän LDS Connector -ohjelmiston testaukseen.
Kurssit ja oppimateriaalit
Verkkokurssi Korpuslingvistiikka ja tilastolliset menetelmät (5 op) järjestetään jälleen 12.1.–27.2.2026. Tämäkin verkkokurssimme on avoin ja ilmainen kaikkien yliopistojen tutkinto-opiskelijoille.
FIN-CLARIAH-tutkimusinfrastruktuurin kuulumisia
FIN-CLARIAH-kiertue
FIN-CLARIAH-hanke esittäytyy eri paikkakunnilla kiertuetapahtumissa, joissa voit kuulla lisää humanististen ja yhteiskuntatieteiden alan ajankohtaisesta tutkimuksesta, menetelmistä, työkaluista ja palveluista. Myös Kielipankki on tietenkin mukana! Seuraavaa kiertuetapahtumaa suunnitellaan parhaillaan Aalto-yliopistoon alkuvuodelle 2026. Tiedot kiertuetapahtumista päivitetään Kielipankin verkkosivuille.
CLARIN myöntää rahoitusta eri tarkoituksiin
Tiesitkö, että CLARINilta voi saada rahoitusta esimerkiksi tutkijoiden ja opettajien liikkuvuuteen tai tapahtumien ja koulutusten järjestämiseen? Tarkista rahoitusmuodot ja haut CLARINin sivuilta: https://www.clarin.eu/funding
Kielipankin henkilökunta lomailee ajalla 23.12.2025–6.1.2026
Kielipankki toivottaa kaikille rentouttavaa vuodenvaihdetta!
Mietta Lennes ja Wilhelmina Dyster
projektisuunnittelijat
fin-clarin@helsinki.fi
Tilaa/peruuta Kielipankin uutiskirje: https://www.kielipankki.fi/kielipankki/uutiskirjeen-tilaus/
Katso myös CLARINin uutiskirje: https://www.clarin.eu/content/newsflash
