Uutisia


Kielipankin aineistoihin liittyviä julkaisuja voi nyt etsiä helposti Google Scholar -palvelusta

17.2.2020

Kielipankin aineistojen viittausohjeisiin on nyt lisätty Google Scholar -hakulinkit, joilla voi kätevästi etsiä aiempia samaan aineistoon liittyviä julkaisuja. Viittausohjeiden noudattaminen kannattaa!


Uusi aineisto (beta): Englantilaisen ja amerikkalaisen kirjallisuuden klassikoita Kersti Juvan suomentamina, englanti–suomi-rinnakkaiskorpus

11.2.2020

Englantilaisen ja amerikkalaisen kirjallisuuden klassikoita Kersti Juvan suomentamina, englanti–suomi-rinnakkaiskorpus, sekoitettu, Korp on nyt käytettävissä beetatestiversiona Korpissa: kuvailutiedot, aineisto Korpissa. Korpus on tarjolla Korpiin kirjautuneille tutkijoille. Kappaleet on sekoitettu kunkin tekstin sisällä. Korpus sisältää seuraavat teokset Kersti Juvan käännöksinä sekä alkuperäisinä: Jane Austen: Ylpeys ja ennakkoluulo (Teos 2013) (Pride and Prejudice) Charles Dickens: Kolea talo (Otava […]


Kuukauden tutkija: Anita Nuopponen

7.2.2020

Kuukauden tutkija: Anita Nuopponen Kuva: Harri Huusko   Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Vaasan yliopiston teknisen viestinnän professori Anita Nuopponen kertoo, miten hän hyödyntää tutkimuksessaan Kielipankin aineistoa Kansalliskirjaston sanoma- ja aikakauslehtikokoelman suomenkielinen osakorpus, Kielipankki-versio. Kuka olet? Olen Anita Nuopponen, teknisen viestinnän professori Vaasa yliopiston markkinoinnin ja viestinnän yksiköstä, […]


Kielipankki esillä NexusLinguarum-hankkeen (COST Action 18209) ensimmäisessä yleiskokouksessa Prahassa

28.1.2020

Mietta Lennes esitteli Kielipankkia NexusLinguarum-nimisen COST-hankkeen kokouksessa Prahassa. Täältä löydät myös Kielipankin posterin.


ParlaCLARIN II -työpaja: Eduskuntatyöskentelyyn ja muuhun poliittiseen keskusteluun liittyvät aineistot

17.1.2020

Vuoden 2020 ParlaCLARIN-työpaja pidetään Marseillessa osana LREC2020-konferenssia (Language Resources and Evaluation Conference). Julkaisukutsu on avoinna 14.2.2020 saakka.


Kuukauden tutkija: Emma Sepänaho

8.1.2020

Kuukauden tutkija: Emma Sepänaho Kuva: Sofia Tikanmäki   Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Helsingin yliopiston maisterivaiheen opiskelija Emma Sepänaho kertoo, miten hän hyödyntää tutkimuksessaan Kielipankin aineistoa 1990- ja 2000-luvun suomalaisia aikakaus- ja sanomalehtiä -korpus, versio 2 . Kuka olet? Olen Emma Sepänaho, neljännen vuoden suomen kielen opiskelija Helsingin […]


Uusia aineistoja (beta): Ylen suomenkielinen uutisarkisto 2012–2018 ja Ylen suomenkielisen uutisarkiston selkouutiset

27.12.2019

Korpissa on nyt käytettävissä beetatestiversioina aineistot Ylen suomenkielinen uutisarkisto 2011–2018, Korp (Korpin korpusvalikon kansiossa Verkkouutisia) ja Ylen suomenkielisen uutisarkiston selkouutiset 2011–2018, Korp (kansiossa Selkokieli). Kummastakin aineistosta on kaksi versiota, jotka sisältävät samat virkkeet mutta joilla on erilainen saatavuus ja erilaiset ominaisuudet: Korpiin kirjautuneiden tutkijoiden käytettävissä olevissa versioissa virkkeet ovat alkuperäisessä järjestyksessä ja aineistot tukevat kappalekontekstia, kun taas […]


Dependenssijäsennysten poikkeavuudet korjattu (Suomi24 2017H2, Semfinlex)

27.12.2019

Syyskuussa 2019 huomatut Suomi24 2017H2 -aineiston ja suomenkielisen Semfinlex-aineiston dependenssijäsennysten ja -relaatioiden poikkeavuudet on viimein korjattu (Semfinlex-aineiston osalta jo aiemmin syksyllä). Pahoittelemme virheitä.


Työsuojelusanasto (TSK-35) ja Kelan terminologinen sanasto – Etuuksiin liittyvät käsitteet 4. laitos (TSK-49) latauspalvelussa

20.12.2019

Latauspalvelusta löytyvät nyt seuraavat sanastot: Sanastokeskus TSK ry Työsuojelusanasto (TSK-35) tarkemmat tiedot, linkki aineistoon ja lisenssi löytyvät kuvailutietueesta http://urn.fi/urn:nbn:fi:lb-2017090407 ja Kelan terminologinen sanasto – Etuuksiin liittyvät käsitteet, 4. laitos (TSK-47) tarkemmat tiedot, linkki aineistoon ja lisenssi löytyvät kuvailutietueesta http://urn.fi/urn:nbn:fi:lb-2017090406  


Eduskunnan täysistuntojen päivitetty latausversio 1.5 julkaistu

18.12.2019

Kielipankin Eduskunnan täysistunnot -korpuksesta on nyt saatavilla päivitetty ladattava versio, johon on lisätty saman aineiston Korp-palvelussa näkyvän version 1.5 mukaiset VRT-muotoiset tekstitiedostot tehokäyttäjiä varten. Samasta aineistosta voi edelleen tehdä hakuja kätevästi suoraan Korp-palvelussa.


AI2D-RST saatavilla Kielipankin latauspalvelusta

13.12.2019

Uusi multimodaalinen korpus AI2D-RST (http://urn.fi/urn:nbn:fi:lb-2019120407), joka sisältää 1000 englanninkielistä, peruskoulutason luonnontieteellisiä ilmiöitä kuvaavaa diagrammia, on nyt saatavilla Kielipankin latauspalvelusta: http://urn.fi/urn:nbn:fi:lb-2019120408 Korpus ja sen annotaatio on kuvattu seuraavassa julkaisussa: https://arxiv.org/abs/1912.03879Lisätietoa ja työkaluja korpuksen käyttöön löytyy myös osoitteesta: https://github.com/thiippal/AI2D-RST


Näin viittaat Kielipankissa oleviin aineistoihin

10.12.2019

Aineistoihin viittaaminen on yhtä tärkeää kuin tieteellisiin julkaisuihin viittaaminen! Katso ohjeet: https://www.kielipankki.fi/tuki/viittaa-kielipankkiin-ja-fin-clariniin/


Käännösmuistit Hallituskausi 2007-2011 ja Hallituskausi 2011-2015 latauspalvelussa

10.12.2019

Käännösmuistit Hallituskausi 2007-2011 ja Hallituskausi 2011-2015 saatavilla latauspalvelussa Valtioneuvoston kanslian kieli-ja käännöspalveluyksikön (https://vnk.fi/kaannos-ja-kielipalvelut) avoimina aineistoina julkaisemat käännösmuistit (suomi-englanti) ovat nyt ladattavissa Kielipankin latauspalvelussa korp.csc.fi/download kansiossa hallituskausi. Aineistojen kuvailutiedot: The ”Hallituskausi 2007–2011” Translation Memory. Korpuksen kuvailutiedot: http://urn.fi/urn:nbn:fi:lb-2017090402 The ”Hallituskausi 2011–2015” Translation Memory. Korpuksen kuvailutiedot: http://urn.fi/urn:nbn:fi:lb-2017090403  


Suomenkielinen OpenSubtitles 2017 ja Wikipedia 2017 latauspalvelussa

10.12.2019

Suomenkielinen OpenSubtitles 2017 ja Suomenkielinen Wikipedia 2017 (lähdemateriaalit) latauspalvelussa Korpukset Suomenkielinen OpenSubtitles 2017, lähdemateriaali  ja Suomenkielinen Wikipedia 2017, lähdemateriaali  ovat saatavilla Kielipankin latauspalvelussa korp.csc.fi/download. Suomenkielinen OpenSubtitles 2017 kattaa Opensubtitles.org sivuston jakamat elokuvien ja tv-ohjelmien suomenkieliset tekstitykset. Korpuksen kuvailutiedot: http://urn.fi/urn:nbn:fi:lb-2019110801 Suomenkielinen Wikipedia 2017 kattaa Wikipedian suomenkielisen artikkelien leipätekstit vuoden 2017 lopulta. Korpuksen kuvailutiedot: http://urn.fi/urn:nbn:fi:lb-2019110803 Molemmat muodostavat […]


Kuukauden tutkija: Katri Leino

9.12.2019

Kuukauden tutkija: Katri Leino Kuva: Katri Leino   Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Aalto-yliopiston tutkijakoulutettava Katri Leino kertoo, miten hän hyödyntää tutkimuksessaan Kielipankin aineistoja Ylen suomenkielisen uutisarkiston selkouutiset 2011-2018, lähdemateriaali ja Suomi 24 -korpus. Kuka olet? Olen Katri Leino, tohtorikoulutettava prof. Mikko Kurimon puheentunnistus-ryhmässä Aalto-yliopistossa. Valmistuin 2015 tietoliikennetekniikan […]


Ylen ruotsinkielinen uutisarkisto 2012–2018

9.12.2019

Korpissa on nyt käytettävissä beetatestiversiona Ylen ruotsinkielinen uutisarkisto (Yle svenska webbartiklar) 2012–2018, Korp -aineisto kahtena versiona, jotka sisältävät samat virkkeet mutta joilla on erilainen saatavuus ja erilaiset ominaisuudet: Korpiin kirjautuneiden tutkijoiden käytettävissä olevassa versiossa(kuvailutiedot, aineisto Korpissa) virkkeet ovat alkuperäisessä järjestyksessä ja aineisto tukee kappalekontekstia, kun taas kaikille avoimessa versiossa (kuvailutiedot, aineisto Korpissa) virkkeet on sekoitettu […]


Open Richly Annotated Cuneiform Corpus 2017-09 versio latauspalvelussa

5.12.2019

Open Richly Annotated Cuneiform Corpus 2017-09 versio latauspalvelussa ORACC:n 2017-09 Korp-version vrt-paketti on nyt erikseen ladattavissa Kielipankin latauspalvelusta: http://urn.fi/urn:nbn:fi:lb-2019111602 Korp palvelussa on tällä hetkellä käytettävissä ORACC:n versio toukokuulta 2019: http://urn.fi/urn:nbn:fi:lb-2019060601


Maisteriopiskelijat: Tervetuloa opetusavustajaksi korpuslingvistiikan verkkokurssille tammi-maaliskuussa 2020!

4.12.2019

Nyt on tilaisuus vilkaista kaksikielisen verkkokurssin kulissien taakse! Maisterivaiheen opiskelijat voivat hakea opetusavustajaksi kevään 2020 verkkokurssille Korpuslingvistiikka ja tilastolliset menetelmät 16.12.2019 saakka.


Eduskunnan täysistunnoista julkaistiin uusi versio Korp-palvelussa – mukana lähes kaikki videot

2.12.2019

Kielipankin Korp-palvelussa olevasta Eduskunnan täysistunnot -korpuksesta on nyt saatavilla päivitetty versio, jonka myötä lähes kaikista hakutuloksista pääsee katsomaan ja kuuntelemaan vastaavia puheenvuoroja täysistuntojen alkuperäisissä videotallenteissa.


Kuukauden tutkija: Maija Saviniemi

11.11.2019

Kuukauden tutkija: Maija Saviniemi Kuva: Tero Mononen   Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Oulun yliopiston yliopistonlehtori Maija Saviniemi kertoo, miten hän hyödyntää tutkimuksessaan Kielipankin aineistoa Iijoki, Oulun yliopiston Päätalo-kokoelma, Kielipankki Korp -versio. Kuka olet? Olen Maija Saviniemi, oululainen yliopistonlehtori ja suomen kielen tutkija. Olen väitellyt kielenhuoltodiskursseista vuonna 2015, […]


< Aiemmat uutiset