
Mila Oiva kertoo kulttuurihistoriaan liittyvästä tutkimuksestaan, jonka myötä on syntynyt mm. Yves Montand Neuvostoliitossa -haastatteluaineisto.
Muinaiskirkkoslaavin korpus latauspalvelussa Corpus Cyrillo-Methodianum Helsingiense: Muinaiskirkkoslaavin korpus, lähdemateriaali on saatavilla latauspalvelussa. Aineisto on tarjolla sekä zip-pakettina että www-sivuina.
Iijoki-kokoelma teksti- sekä VRT-muodossa latauspalvelussa Iijoki, Oulun yliopiston Päätalo-kokoelma on saatavilla latauspalvelussa tekstimuotoisena lähdeaineistona sekä jäsennettynä VRT-muodossa.
Gwenaëlle Bauvois kertoo Kielipankissa olevaan Eduskunnan täysistuntojen ladattavaan versioon 1 ja muihin media-aineistoihin liittyvästä tutkimuksestaan.
Ylen uutisarkisto VRT-muodossa latauspalvelussa Lähdemateriaalien lisäksi Ylen uutisaineistot ovat nyt ladattavissa VRT-muodossa Kielipankin latauspalvelusta kahtena versiona, jotka sisältävät samat virkkeet mutta joilla on erilainen saatavuus ja erilaiset ominaisuudet: Kirjautuneiden tutkijoiden […]
FinEst BERT latauspalvelussa FinEst BERT, kolmella kielellä (suomea, eesti ja englantia) harjoitettu monikielinen BERT on saatavilla Kielipankin latauspalvelussa korp.csc.fi/download. FinEst BERT: korpuksen kuvailutiedot, korpus latauspalvelussa
STT:n uutisarkisto 1992-2018, CoNLL-U, lähdemateriaali latauspalvelussa Korpus on saatavilla Kielipankin latauspalvelussa korp.csc.fi/download. Tämä on jäsennetty versio STT:n uutisarkisto 1992-2018, lähdemateriaali:sta. Khalid Alnajjar (Helsingin yliopisto) jäsensi korpuksen käyttämällä Turku neural parser […]
Heikki Rasilo kertoo puheentuottoon liittyvästä tutkimustyöstään, jossa hän on hyödyntänyt Kielipankissa olevaa Aalto-yliopiston DSP-kurssin keskustelukorpusta.
Tuomo Hiippala pitää Helsingin yliopistossa verkkokurssin Natural Language Processing for Linguists ajalla 15.3.2021 -10.5.2021. Ilmoittaudu mukaan 16.3.2021 mennessä tai katso itseopiskelumateriaalit.
Kotimaisten kielten keskuksen aikakauslehtikorpus, tarkistettu ja Kotimaisten kielten keskuksen aikakauslehtikorpus, tarkistamaton ovat nyt käytettävissä beetatestiversioina Korpissa.
Käännössuomen korpus, Korp on nyt käytettävissä beetatestiversiona Korpissa.
Helsingin yliopiston englanninkielinen E-thesis 1999-2016 on päivitetty versioon 1.1. Gradu- ja väitöskirjakorpuksiin on tehty seuraavia muutoksia: Aineisto on jäsennetty Turku Neural Parser Pipeline (TNPP) -jäsentimellä. Tekstit, joissa on vähemmän kuin […]
Toimittaako yrityksesi litterointipalveluita? Jätä tarjous Lahjoita puhetta -aineiston litteroinnista Hanki-tarjouspalveluun 15.3.2021 klo 14.00 mennessä.
Emmi Lahti kertoo retoriikkaan ja diskurssintutkimukseen liittyvästä tutkimustyöstään, jossa hän on hyödyntänyt Kielipankissa olevaa Suomi24-korpusta.
Tietoarkiston julkaisema Tutkimusmenetelmien verkkokäsikirja koostuu Kvantitatiivisen tutkimuksen verkkokäsikirjasta ja Laadullisen tutkimuksen verkkokäsikirjasta. Materiaaleja voi käyttää opiskelussa ja opetuksessa.
Professori Mats Fridlund kertoo digitaaliseen historiaan liittyvästä tutkimustyöstään, jonka tukena ovat työkalut ja aineistot sekä suomalaisessa Kielipankissa että Ruotsin Språkbankenissa.
Parivuotista post doc-kauttaan parhaillaan aloitteleva Kielipankin projektisuunnittelija Tommi Jauhiainen kertoo Kielipankin palveluihin ja aineistoihin liittyvistä tutkimuksistaan.
Korp-palvelin vaihtuu 10.12.2020 Korp-palvelu siirretään 10.12.2020 toiselle palvelimelle teknisistä syistä. Korp-palvelun osoitteena säilyy toistaiseksi https://korp.csc.fi. Palvelimen vaihtuminen ei aiheuta käyttökatkoa, ja muutenkin Korpin on tarkoitus toimia uudella palvelimella samoin kuin ennen. Sanakuvaominaisuus toimii […]
Aiheena tällä kertaa erityisesti puheaineistot ja tietosuojakäytänteet, esiintyjinä asiantuntevia tutkijavieraita. Ilmoittaudu nyt!
FinnSentiment – A Finnish Social Media Corpus for Sentiment Polarity Annotation FinnSentiment korpus on nyt ladattavissa Kielipankin latauspalvelusta: kuvailutiedot, aineisto latauspalvelussa. FinnSentiment sisältää 27,000 yksittäistä virkettä Suomi 24 aineistosta sekä […]
| < Aiemmat uutiset | Tuoreemmat uutiset > |