Uutisia


Kuukauden tutkija: Juho Leinonen

20.9.2021

Juho Leinonen kertoo puheen automaattiseen tunnistamiseen ja kohdistamiseen sekä chattibotteihin liittyvistä tutkimuksistaan.


Uusia aineistoja (beta): Englantilaisen ja amerikkalaisen kirjallisuuden klassikoita Kersti Juvan suomentamina, englanti-suomi-rinnakkaiskorpus, Korp

16.9.2021

Englantilaisen ja amerikkalaisen kirjallisuuden klassikoita Kersti Juvan suomentamina, englanti-suomi-rinnakkaiskorpus, Korp on nyt käytettävissä beetatestiversiona Korpissa.


Finnish OpenSubtitles 2017, VRT latauspalvelussa

16.9.2021

Finnish OpenSubtitles 2017, VRT latauspalvelussa Finnish OpenSubtitles 2017 on saatavilla VRT-muotoisena Kielipankin latauspalvelussa www.kielipankki.fi/download. Finnish OpenSubtitles 2017, VRT: korpuksen kuvailutiedot, korpus latauspalvelussa Lisätiedot löytyvät aineistoryhmäsivulta.


Kuukauden tutkija: Okko Räsänen

18.8.2021

Okko Räsänen kertoo lapsen puheenkehityksen laskennalliseen mallintamiseen liittyvistä tutkimuksistaan.


Kuukauden tutkija: Olli Kuparinen

12.7.2021

Olli Kuparinen kertoo suomen kielen variaatioon ja muutokseen liittyvästä tutkimuksistaan, joissa hän on käyttänyt mm. Helsingin puhekielen pitkittäiskorpusta (1970, 1990, 2010) , Suomen kielen näytteitä -korpusta ja Lauseopin arkiston murrekorpusta.


Reitti A-siipeen -korpuksen ladattava versio on nyt saatavilla

1.7.2021

Vanha kunnon ”Reittidemo” on nyt saatavilla Kielipankin latauspalvelussa. Erilaisiin kokeiluihin ja demoihin tarkoitettu aineisto on käytettävissä täysin avoimella lisenssillä (CC0, public domain).


Helsinki Corpus of English Texts, VRT latauspalvelussa

1.7.2021

Helsinki Corpus of English Texts, VRT latauspalvelussa Helsinki Corpus of English Texts VRT-muodossa on saatavilla Kielipankin latauspalvelussa www.kielipankki.fi/download. Helsinki Corpus of English Texts, VRT: korpuksen kuvailutiedot, korpus latauspalvelussa Lisätiedot löytyvät aineistoryhmäsivulta.


Helsinki Corpus of Scottish Correspondence (1540-1750), VRT latauspalvelussa

1.7.2021

Helsinki Corpus of Scottish Correspondence (1540-1750), VRT latauspalvelussa Helsinki Corpus of Scottish Correspondence (1540-1750) VRT-muodossa on saatavilla Kielipankin latauspalvelussa www.kielipankki.fi/download. Helsinki Corpus of Scottish Correspondence (1540-1750), VRT: korpuksen kuvailutiedot, korpus latauspalvelussa Lisää tiedot löytyvät aineistoryhmäsivulta.


Ylen suomenkielisen uutisarkiston selkouutiset 2019-2020, lähdemateriaali latauspalvelussa

1.7.2021

Ylen suomenkielisen uutisarkiston selkouutiset 2019-2020, lähdemateriaali latauspalvelussa Korpus, joka sisältää artikkelit YLE -sivulta https://yle.fi/uutiset/osasto/selkouutiset/ vuosilta 2019 ja 2020, on saatavilla Kielipankin latauspalvelussa www.kielipankki.fi/download/. Ylen suomenkielisen uutisarkiston selkouutiset 2019-2020, lähdemateriaali: Korpuksen kuvailutiedot, korpus latauspalvelussa Kaikki käytettävissä olevat Ylen uutisarkisto -aineistot löytyvät aineistoryhmäsivulta.


Nyt latauspalvelussa: Haastatteluaineisto Yves Montand Neuvostoliitossa, lähdemateriaali

29.6.2021

Nyt latauspalvelussa: Haastatteluaineisto Yves Montand Neuvostoliitossa, lähdemateriaali Haastatteluaineisto Yves Montand Neuvostoliitossa, lähdemateriaali (MONTINT-aineisto) on nyt saatavilla Kielipankin latauspalvelussa. Aineistoon pohjautuvaa tutkimusta on julkaistu myös tuoreessa teoksessa: Oiva, Mila; Salmi, Hannu; Johnson, Bruce (2021). Yves Montand in the USSR: Cultural Diplomacy and Mixed Messages. Palgrave Macmillan, Cham. http://doi.org/10.1007/978-3-030-69048-9


Englantilaisen ja amerikkalaisen kirjallisuuden klassikoita Kersti Juvan suomentamina, englanti-suomi-rinnakkaiskorpus, sekoitettu, ladattava versio

22.6.2021

Englantilaisen ja amerikkalaisen kirjallisuuden klassikoita Kersti Juvan suomentamina, englanti-suomi-rinnakkaiskorpus, sekoitettu, ladattava versio Englantilaisen ja amerikkalaisen kirjallisuuden klassikoita Kersti Juvan suomentamina, englanti-suomi-rinnakkaiskorpus, sekoitettu, ladattava versio on nyt latauspalvelussa.


Kuukauden tutkija: Karita Suomalainen

15.6.2021

Karita Suomalainen kertoo ”sä-passiiviin” ja muihin vuorovaikutuksen kieliopillisiin rakenteisiin liittyvästä tutkimuksestaan, jossa hän on käyttänyt mm. Suomenkielisten arkikeskustelujen morfosyntaktista tietokantaa (Arkisyn), Lauseopin arkiston murrekorpusta ja Suomi 24 -korpusta.


ANEE:n leksikaaliset portaalit akkadille

11.6.2021

ANEE:n leksikaaliset portaalit akkadille Muinaisen Lähi-idän imperiumit-huippuyksikön (ANEE) tiimi 1 on luonut kaksi leksikaalista portaalia joissa ensimmäistä kertaa havainnollistetaan akkadinkielisten sanojen leksikaalisia suhteita sanaverkkoina. Käyttämällä fastText ja Pointwise Mutual Information (PMI) menetelmiä olemme luoneet leksikaaliset portaalit jotka mallintavat paradigmaattisia ja syntagmaattisia suhteita sanojen välillä.


Kielentunnistin HeLI-OTS 1.0 nyt ladattavissa Zenodosta

9.6.2021

Kielentunnistin HeLI-OTS 1.0 nyt ladattavissa Zenodosta HeLI-OTS 1.0 on yleiskäyttöinen kielentunnistin, joka pystyy automaattisesti tunnistamaan jokaisen annetussa tekstitiedostossa olevan tekstirivin kielen. HeLI-OTS 1.0 valitsee sopivimman vaihtoehdon 200 kielen joukosta. HeLI-OTS 1.0 on julkaistu Helsingin yliopiston ja Lingsoft Oy:n yhteistyöprojektissa Language Identification of Speech and Text, joka on saanut rahoitusta Vaikuttavuussäätiön “Tandem Industry Academia 2020” -hausta. […]


Ylen suomenkielinen uutisarkisto 2019-2020, lähdeaineisto latauspalvelussa

27.5.2021

Ylen suomenkielinen uutisarkisto 2019-2020, lähdeaineisto latauspalvelussa Korpus, joka sisältää artikkelit YLE -sivulta https://yle.fi vuosilta 2019 ja 2020, on saatavilla Kielipankin latauspalvelussa www.kielipankki.fi/download. Ylen suomenkielinen uutisarkisto 2019-2020, lähdeaineisto: Korpuksen kuvailutiedot, korpus latauspalvelussa Kaikki käytettävissä olevat Ylen uutisarkisto -aineistot löytyvät aineistoryhmäsivulta.


Ylen ruotsinkielinen uutisarkisto 2019-2020, lähdeaineisto latauspalvelussa

27.5.2021

Ylen ruotsinkielinen uutisarkisto 2019-2020, lähdeaineisto latauspalvelussa Korpus, joka sisältää artikkelit Svenska YLE -sivulta https://svenska.yle.fi vuosilta 2019 ja 2020, on saatavilla Kielipankin latauspalvelussa www.kielipankki.fi/download. Ylen ruotsinkielinen uutisarkisto 2019-2020, lähdeaineisto: Korpuksen kuvailutiedot, korpus latauspalvelussa Kaikki käytettävissä olevat Ylen uutisarkisto -aineistot löytyvät aineistoryhmäsivulta.


Kielipankki, puheteknologia ja Lahjoita puhetta -kampanja esillä Telian podcastissa

12.5.2021

Kielipankin projektisuunnittelija Mietta Lennes keskustelee Kia Tolppasen ja Harri Moision kanssa puheentunnistuksesta ja puheteknologian merkityksestä Telian podcastissa 12.5.2021.


Kuukauden tutkija: Mila Oiva

10.5.2021

Mila Oiva kertoo kulttuurihistoriaan liittyvästä tutkimuksestaan, jonka myötä on syntynyt mm. Yves Montand Neuvostoliitossa -haastatteluaineisto.


Muinaiskirkkoslaavin korpus latauspalvelussa

23.4.2021

Muinaiskirkkoslaavin korpus latauspalvelussa Corpus Cyrillo-Methodianum Helsingiense: Muinaiskirkkoslaavin korpus, lähdemateriaali on saatavilla latauspalvelussa. Aineisto on tarjolla sekä zip-pakettina että www-sivuina.


Iijoki-kokoelma latauspalvelussa

16.4.2021

Iijoki-kokoelma teksti- sekä VRT-muodossa latauspalvelussa Iijoki, Oulun yliopiston Päätalo-kokoelma on saatavilla latauspalvelussa tekstimuotoisena lähdeaineistona sekä jäsennettynä VRT-muodossa.


< Aiemmat uutiset