
Kielipankin sivuilla on nyt ohjeet, joiden tarkoitus on helpottaa tutkimuskäyttöä koskevan tietosuojailmoituksen tekemistä. Huomaa kuitenkin, että sinun tulee noudattaa henkilötietojen käsittelyssä aina ensisijaisesti oman organisaatiosi antamia tietosuojaohjeita.
Kansalliskirjaston sanoma- ja aikakauslehtikokoelman suomenkielisen osakorpuksen versio 2 on nyt käytettävissä beetatestiversiona Korp-palvelun kautta. Aineisto sisältää Kansalliskirjaston lehtikokoelman sanoma- ja aikakauslehtiä vuosilta 1771–2021. Aineistossa on yhteensä yli 22 miljardia sanetta.
In English Kuukauden tutkija: Mikael Varjo Kuva: Emmi Saari Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Mikael Varjo kertoo meille tutkimuksestaan, joka käsittelee suomenkielisten arkikeskustelujen […]
Uusi aineisto (beta): Rinnakkaiskorpus L. Uspenskin kirjasta ”Neljä taistelua”; Korp-versio Rinnakkaiskorpus L. Uspenskin kirjasta ”Neljä taistelua”; Korp-versio on nyt käytettävissä beetatestiversiona Korpissa. Huomaa, että korpus on beetatestivaiheessa, joten siihen voi […]
Suomenkielisen pimeän verkon kauppapaikka-aineisto (findarc) on hakemuksesta saatavilla rajoitettuun tutkimuskäyttöön.
Uusi aineisto: The Movie Corpus (Mark Davies, english-corpora.org) – Kielipankin versio, lähdemateriaali The Movie Corpus (Mark Davies, english-corpora.org) – Kielipankin versio, lähdemateriaali on saatavilla Kielipankin latauspalvelussa. Lisätiedot löytyvät aineistoryhmäsivulta.
Uusi aineisto: The Coronavirus Corpus (Mark Davies, english-corpora.org) – Kielipankin versio 2021-05, lähdemateriaali The Coronavirus Corpus (Mark Davies, english-corpora.org) – Kielipankin versio 2021-05, lähdemateriaali on saatavilla Kielipankin latauspalvelussa. Lisätiedot löytyvät […]
In English Kuukauden tutkija: Rosa González Hautamäki Kuva: Ville Hautamäki Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Rosa González Hautamäki kertoo meille tutkimuksistaan, jotka liittyvät […]
Harjoittele kielivarojen käsittelyä kaksipäiväisellä etäkurssilla – CSC järjestää koulutuksen kesäkuussa Kiinnostaako sinua oppia käyttämään CSC:n laskennallista ympäristöä kielivarojen käsittelyyn? Haluatko tietää lisää kielivaroista ja mahdollisuuksista käyttää niitä tutkimuksessasi? CSC – […]
Uusi aineisto (beta): STT:n uutisarkisto 1992-2018, Kielipankin Korp-versio STT:n uutisarkisto 1992-2018, Kielipankin Korp-versio on nyt käytettävissä beetatestiversiona Korpissa. Huomaa, että korpus on beetatestivaiheessa, joten siihen voi tulla muutoksia ilman ilmoitusta. […]
In English Kuukauden tutkija: Johanna Vaattovaara Kuva: Antti Yrjönen Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Johanna Vaattovaara kertoo meille kielitietoisuuteen ja kieliasenteisiin liittyvistä tutkimuksistaan. […]
Uusi aineisto (beta): ERME Ersän ja mokšan laajennettu korpus versio 2, Korp ERME Ersän ja mokšan laajennettu korpus versio 2, Korp on nyt käytettävissä beetatestiversiona Korpissa. Huomaa, että aineisto on […]
In English Kuukauden tutkija: Noora Hoffrén Kuva: Essi Ekman Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Noora Hoffrén kertoo meille väitöskirjatutkimuksestaan, jonka aiheena on konstruoitu […]
Uusia aineistoja: word2vec-menetelmällä harjoitetut sanaupotukset word2vec-menetelmällä harjoitetut sanaupotukset Suomen kielen tekstikokoelmasta: kuvailutiedot, aineisto latauspalvelussa word2vec-menetelmällä harjoitetut sanaupotukset Suomi24-korpuksesta: kuvailutiedot, aineisto latauspalvelussa Lisätiedot löytyvät aineistoryhmäsivulta.
Uusi aineisto: FinnSentiment 1.1, lähdemateriaali FinnSentiment 1.1, lähdemateriaali on saatavilla Kielipankin latauspalvelussa. Lisätiedot löytyvät aineistoryhmäsivulta.
In English Kuukauden tutkija: Maria Sarhemaa Kuva: K-Art Foto Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Maria Sarhemaa kertoo meille tutkimuksestaan, jossa hän on selvittänyt […]
Lisämateriaali: Suomen kielen näytteitä, ladattava versio Suomen kielen näytteitä, ladattava versio on ollut saatavilla Kielipankin latauspalvelun kautta sen jälkeen, kun LAT-alusta poistui käytöstä vuonna 2020. Alkuperäisestä aineistosta tehdyistä latauspaketeista jäi […]
In English Månadens forskare: Therese Lindström Tiedemann Foto: Tove Tiedemann Språkbanken i Finland (Kielipankki) är en tjänst för forskare som använder språkresurser. Therese Lindström Tiedemann berättar om sin forskning om […]
Kielipankin uutiskirje 2/2022 In English Kuukauden tutkijat vuonna 2022 Jussi Ylikoski – suomalais-ugrilainen kielentutkimus, kielioppi, etymologia Tuisku Vilenius – saamelaisdiskurssit internetkeskusteluissa Ari Huhta – kielitaidon arviointi, vieraan ja toisen kielen […]
Uusi automaattinen puheentunnistuspalvelu Tekstiks on testikäytössä. Automatisoitu järjestelmä pystyy tunnistamaan puhuttua viroa ja suomea sekä tuottamaan äänitteestä tekstimuotoisen litteraatin. Ohjelmassa on myös käyttöliittymä litteroidun tekstin muokkaamiseen.
| < Aiemmat uutiset | Tuoreemmat uutiset > |