
Kuukauden tutkija: Markus Mattila Kuva: Markus Mattila Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Åbo Akademista valmistunut FM Markus Mattila kertoo, miten hän hyödyntää […]
Suomi24 2001–2017: Korjattu kirjoittajan nimimerkkitietoja Suomi24 2001–2017 -aineistosta on nyt käytössä Korp-versio 1.1, jossa on korjattu kirjoittajan nimimerkkitietoja. Aineistoon on tehty seuraavat muutokset: – Kaikissa viesteissä on kirjoittajan nimimerkki myös […]
Kielipankin aineistojen viittausohjeisiin on nyt lisätty Google Scholar -hakulinkit, joilla voi kätevästi etsiä aiempia samaan aineistoon liittyviä julkaisuja. Viittausohjeiden noudattaminen kannattaa!
Englantilaisen ja amerikkalaisen kirjallisuuden klassikoita Kersti Juvan suomentamina, englanti–suomi-rinnakkaiskorpus, sekoitettu, Korp on nyt käytettävissä beetatestiversiona Korpissa: kuvailutiedot, aineisto Korpissa. Korpus on tarjolla Korpiin kirjautuneille tutkijoille. Kappaleet on sekoitettu kunkin tekstin […]
Kuukauden tutkija: Anita Nuopponen Kuva: Harri Huusko Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Vaasan yliopiston teknisen viestinnän professori Anita Nuopponen kertoo, miten hän […]
Mietta Lennes esitteli Kielipankkia NexusLinguarum-nimisen COST-hankkeen kokouksessa Prahassa. Täältä löydät myös Kielipankin posterin.
Vuoden 2020 ParlaCLARIN-työpaja pidetään Marseillessa osana LREC2020-konferenssia (Language Resources and Evaluation Conference). Julkaisukutsu on avoinna 14.2.2020 saakka.
Kuukauden tutkija: Emma Sepänaho Kuva: Sofia Tikanmäki Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Helsingin yliopiston maisterivaiheen opiskelija Emma Sepänaho kertoo, miten hän hyödyntää […]
Korpissa on nyt käytettävissä beetatestiversioina aineistot Ylen suomenkielinen uutisarkisto 2011–2018, Korp (Korpin korpusvalikon kansiossa Verkkouutisia) ja Ylen suomenkielisen uutisarkiston selkouutiset 2011–2018, Korp (kansiossa Selkokieli). Kummastakin aineistosta on kaksi versiota, jotka sisältävät […]
Syyskuussa 2019 huomatut Suomi24 2017H2 -aineiston ja suomenkielisen Semfinlex-aineiston dependenssijäsennysten ja -relaatioiden poikkeavuudet on viimein korjattu (Semfinlex-aineiston osalta jo aiemmin syksyllä). Pahoittelemme virheitä.
Latauspalvelusta löytyvät nyt seuraavat sanastot: Sanastokeskus TSK ry Työsuojelusanasto (TSK-35) tarkemmat tiedot, linkki aineistoon ja lisenssi löytyvät kuvailutietueesta http://urn.fi/urn:nbn:fi:lb-2017090407 ja Kelan terminologinen sanasto – Etuuksiin liittyvät käsitteet, 4. laitos (TSK-47) […]
Kielipankin Eduskunnan täysistunnot -korpuksesta on nyt saatavilla päivitetty ladattava versio, johon on lisätty saman aineiston Korp-palvelussa näkyvän version 1.5 mukaiset VRT-muotoiset tekstitiedostot tehokäyttäjiä varten. Samasta aineistosta voi edelleen tehdä hakuja kätevästi suoraan Korp-palvelussa.
Uusi multimodaalinen korpus AI2D-RST (http://urn.fi/urn:nbn:fi:lb-2019120407), joka sisältää 1000 englanninkielistä, peruskoulutason luonnontieteellisiä ilmiöitä kuvaavaa diagrammia, on nyt saatavilla Kielipankin latauspalvelusta: http://urn.fi/urn:nbn:fi:lb-2019120408 Korpus ja sen annotaatio on kuvattu seuraavassa julkaisussa: https://arxiv.org/abs/1912.03879Lisätietoa ja työkaluja korpuksen […]
Aineistoihin viittaaminen on yhtä tärkeää kuin tieteellisiin julkaisuihin viittaaminen! Katso ohjeet: https://www.kielipankki.fi/tuki/viittaa-kielipankkiin-ja-fin-clariniin/
Käännösmuistit Hallituskausi 2007-2011 ja Hallituskausi 2011-2015 saatavilla latauspalvelussa Valtioneuvoston kanslian kieli-ja käännöspalveluyksikön (https://vnk.fi/kaannos-ja-kielipalvelut) avoimina aineistoina julkaisemat käännösmuistit (suomi-englanti) ovat nyt ladattavissa Kielipankin latauspalvelussa korp.csc.fi/download kansiossa hallituskausi. Aineistojen kuvailutiedot: The ”Hallituskausi […]
Suomenkielinen OpenSubtitles 2017 ja Suomenkielinen Wikipedia 2017 (lähdemateriaalit) latauspalvelussa Korpukset Suomenkielinen OpenSubtitles 2017, lähdemateriaali ja Suomenkielinen Wikipedia 2017, lähdemateriaali ovat saatavilla Kielipankin latauspalvelussa korp.csc.fi/download. Suomenkielinen OpenSubtitles 2017 kattaa Opensubtitles.org sivuston […]
Kuukauden tutkija: Katri Leino Kuva: Katri Leino Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Aalto-yliopiston tutkijakoulutettava Katri Leino kertoo, miten hän hyödyntää tutkimuksessaan Kielipankin […]
Korpissa on nyt käytettävissä beetatestiversiona Ylen ruotsinkielinen uutisarkisto (Yle svenska webbartiklar) 2012–2018, Korp -aineisto kahtena versiona, jotka sisältävät samat virkkeet mutta joilla on erilainen saatavuus ja erilaiset ominaisuudet: Korpiin kirjautuneiden […]
Open Richly Annotated Cuneiform Corpus 2017-09 versio latauspalvelussa ORACC:n 2017-09 Korp-version vrt-paketti on nyt erikseen ladattavissa Kielipankin latauspalvelusta: http://urn.fi/urn:nbn:fi:lb-2019111602 Korp palvelussa on tällä hetkellä käytettävissä ORACC:n versio toukokuulta 2019: http://urn.fi/urn:nbn:fi:lb-2019060601
Nyt on tilaisuus vilkaista kaksikielisen verkkokurssin kulissien taakse! Maisterivaiheen opiskelijat voivat hakea opetusavustajaksi kevään 2020 verkkokurssille Korpuslingvistiikka ja tilastolliset menetelmät 16.12.2019 saakka.
| < Aiemmat uutiset | Tuoreemmat uutiset > |