Uutisia


Kuukauden tutkija: Veronika Laippala

20.10.2021

Veronika Laippala kertoo suuriin kieliaineistoihin ja laskennallisiin menetelmiin liittyvästä tutkimuksestaan.


Uusi aineisto: Terminologiafoorumin sanastoja (kokoelma), lähdeaineisto

5.10.2021

Uusi aineisto: Terminologiafoorumin sanastoja (kokoelma), lähdeaineisto Terminologiafoorumin sanastoja (kokoelma), lähdeaineisto on saatavilla Kielipankin latauspalvelussa. Lisätiedot löytyvät aineistoryhmäsivulta.


Aalto-ASR-puheentunnistustyökalujen uusi versio 2.1 on käytettävissä

4.10.2021

Aalto-yliopistossa kehitetyn Aalto-ASR -puheentunnistimen ja -kohdistimen uudistettu versio 2.1 on nyt käytettävissä CSC:n Puhti-palvelimella sekä Docker-säiliönä. Suomenkieliset ohjeet löytyvät Kielipankin sivuilta.


CLARINin opetuspalkinnot Suomeen, Sloveniaan ja Englantiin

4.10.2021

Vuonna 2021 CLARIN jakoi ensimmäistä kertaa Teaching with CLARIN Award -opetuspalkintoja. Palkinnon saivat Darja Fišer ja Kristina Pahor de Maiti Sloveniasta, Mietta Lennes Suomesta ja Diana Maynard Englannista.


Uusi aineisto (beta): Kansalliskirjaston klassikkokirjaston suomenkielinen osakorpus – Kielipankki-versio

28.9.2021

Kansalliskirjaston klassikkokirjaston suomenkielinen osakorpus – Kielipankki-versio on nyt käytettävissä beetatestiversiona Korpissa. Kansalliskirjaston klassikkokirjaston suomenkielinen osakorpus – Kielipankki-versio: Korpuksen kuvailutiedot, korpus Korp-palvelussa Lisätiedot löytyvät aineistoryhmäsivulta.


Kuukauden tutkija: Juho Leinonen

20.9.2021

Juho Leinonen kertoo puheen automaattiseen tunnistamiseen ja kohdistamiseen sekä chattibotteihin liittyvistä tutkimuksistaan.


Uusia aineistoja (beta): Englantilaisen ja amerikkalaisen kirjallisuuden klassikoita Kersti Juvan suomentamina, englanti-suomi-rinnakkaiskorpus, Korp

16.9.2021

Englantilaisen ja amerikkalaisen kirjallisuuden klassikoita Kersti Juvan suomentamina, englanti-suomi-rinnakkaiskorpus, Korp on nyt käytettävissä beetatestiversiona Korpissa.


Finnish OpenSubtitles 2017, VRT latauspalvelussa

16.9.2021

Finnish OpenSubtitles 2017, VRT latauspalvelussa Finnish OpenSubtitles 2017 on saatavilla VRT-muotoisena Kielipankin latauspalvelussa www.kielipankki.fi/download. Finnish OpenSubtitles 2017, VRT: korpuksen kuvailutiedot, korpus latauspalvelussa Lisätiedot löytyvät aineistoryhmäsivulta.


Kuukauden tutkija: Okko Räsänen

18.8.2021

Okko Räsänen kertoo lapsen puheenkehityksen laskennalliseen mallintamiseen liittyvistä tutkimuksistaan.


Kuukauden tutkija: Olli Kuparinen

12.7.2021

Olli Kuparinen kertoo suomen kielen variaatioon ja muutokseen liittyvästä tutkimuksistaan, joissa hän on käyttänyt mm. Helsingin puhekielen pitkittäiskorpusta (1970, 1990, 2010) , Suomen kielen näytteitä -korpusta ja Lauseopin arkiston murrekorpusta.


Reitti A-siipeen -korpuksen ladattava versio on nyt saatavilla

1.7.2021

Vanha kunnon ”Reittidemo” on nyt saatavilla Kielipankin latauspalvelussa. Erilaisiin kokeiluihin ja demoihin tarkoitettu aineisto on käytettävissä täysin avoimella lisenssillä (CC0, public domain).


Helsinki Corpus of English Texts, VRT latauspalvelussa

1.7.2021

Helsinki Corpus of English Texts, VRT latauspalvelussa Helsinki Corpus of English Texts VRT-muodossa on saatavilla Kielipankin latauspalvelussa www.kielipankki.fi/download. Helsinki Corpus of English Texts, VRT: korpuksen kuvailutiedot, korpus latauspalvelussa Lisätiedot löytyvät aineistoryhmäsivulta.


Helsinki Corpus of Scottish Correspondence (1540-1750), VRT latauspalvelussa

1.7.2021

Helsinki Corpus of Scottish Correspondence (1540-1750), VRT latauspalvelussa Helsinki Corpus of Scottish Correspondence (1540-1750) VRT-muodossa on saatavilla Kielipankin latauspalvelussa www.kielipankki.fi/download. Helsinki Corpus of Scottish Correspondence (1540-1750), VRT: korpuksen kuvailutiedot, korpus latauspalvelussa Lisää tiedot löytyvät aineistoryhmäsivulta.


Ylen suomenkielisen uutisarkiston selkouutiset 2019-2020, lähdemateriaali latauspalvelussa

1.7.2021

Ylen suomenkielisen uutisarkiston selkouutiset 2019-2020, lähdemateriaali latauspalvelussa Korpus, joka sisältää artikkelit YLE -sivulta https://yle.fi/uutiset/osasto/selkouutiset/ vuosilta 2019 ja 2020, on saatavilla Kielipankin latauspalvelussa www.kielipankki.fi/download/. Ylen suomenkielisen uutisarkiston selkouutiset 2019-2020, lähdemateriaali: Korpuksen kuvailutiedot, korpus latauspalvelussa Kaikki käytettävissä olevat Ylen uutisarkisto -aineistot löytyvät aineistoryhmäsivulta.


Nyt latauspalvelussa: Haastatteluaineisto Yves Montand Neuvostoliitossa, lähdemateriaali

29.6.2021

Nyt latauspalvelussa: Haastatteluaineisto Yves Montand Neuvostoliitossa, lähdemateriaali Haastatteluaineisto Yves Montand Neuvostoliitossa, lähdemateriaali (MONTINT-aineisto) on nyt saatavilla Kielipankin latauspalvelussa. Aineistoon pohjautuvaa tutkimusta on julkaistu myös tuoreessa teoksessa: Oiva, Mila; Salmi, Hannu; Johnson, Bruce (2021). Yves Montand in the USSR: Cultural Diplomacy and Mixed Messages. Palgrave Macmillan, Cham. http://doi.org/10.1007/978-3-030-69048-9


Englantilaisen ja amerikkalaisen kirjallisuuden klassikoita Kersti Juvan suomentamina, englanti-suomi-rinnakkaiskorpus, sekoitettu, ladattava versio

22.6.2021

Englantilaisen ja amerikkalaisen kirjallisuuden klassikoita Kersti Juvan suomentamina, englanti-suomi-rinnakkaiskorpus, sekoitettu, ladattava versio Englantilaisen ja amerikkalaisen kirjallisuuden klassikoita Kersti Juvan suomentamina, englanti-suomi-rinnakkaiskorpus, sekoitettu, ladattava versio on nyt latauspalvelussa.


Kuukauden tutkija: Karita Suomalainen

15.6.2021

Karita Suomalainen kertoo ”sä-passiiviin” ja muihin vuorovaikutuksen kieliopillisiin rakenteisiin liittyvästä tutkimuksestaan, jossa hän on käyttänyt mm. Suomenkielisten arkikeskustelujen morfosyntaktista tietokantaa (Arkisyn), Lauseopin arkiston murrekorpusta ja Suomi 24 -korpusta.


ANEE:n leksikaaliset portaalit akkadille

11.6.2021

ANEE:n leksikaaliset portaalit akkadille Muinaisen Lähi-idän imperiumit-huippuyksikön (ANEE) tiimi 1 on luonut kaksi leksikaalista portaalia joissa ensimmäistä kertaa havainnollistetaan akkadinkielisten sanojen leksikaalisia suhteita sanaverkkoina. Käyttämällä fastText ja Pointwise Mutual Information (PMI) menetelmiä olemme luoneet leksikaaliset portaalit jotka mallintavat paradigmaattisia ja syntagmaattisia suhteita sanojen välillä.


Kielentunnistin HeLI-OTS 1.0 nyt ladattavissa Zenodosta

9.6.2021

Kielentunnistin HeLI-OTS 1.0 nyt ladattavissa Zenodosta HeLI-OTS 1.0 on yleiskäyttöinen kielentunnistin, joka pystyy automaattisesti tunnistamaan jokaisen annetussa tekstitiedostossa olevan tekstirivin kielen. HeLI-OTS 1.0 valitsee sopivimman vaihtoehdon 200 kielen joukosta. HeLI-OTS 1.0 on julkaistu Helsingin yliopiston ja Lingsoft Oy:n yhteistyöprojektissa Language Identification of Speech and Text, joka on saanut rahoitusta Vaikuttavuussäätiön “Tandem Industry Academia 2020” -hausta. […]


Ylen suomenkielinen uutisarkisto 2019-2020, lähdeaineisto latauspalvelussa

27.5.2021

Ylen suomenkielinen uutisarkisto 2019-2020, lähdeaineisto latauspalvelussa Korpus, joka sisältää artikkelit YLE -sivulta https://yle.fi vuosilta 2019 ja 2020, on saatavilla Kielipankin latauspalvelussa www.kielipankki.fi/download. Ylen suomenkielinen uutisarkisto 2019-2020, lähdeaineisto: Korpuksen kuvailutiedot, korpus latauspalvelussa Kaikki käytettävissä olevat Ylen uutisarkisto -aineistot löytyvät aineistoryhmäsivulta.


< Aiemmat uutiset