Uutisia


Uusia aineistoja (beta): Ylen suomenkielinen uutisarkisto 2012–2018 ja Ylen suomenkielisen uutisarkiston selkouutiset

27.12.2019

Korpissa on nyt käytettävissä beetatestiversioina aineistot Ylen suomenkielinen uutisarkisto 2011–2018, Korp (Korpin korpusvalikon kansiossa Verkkouutisia) ja Ylen suomenkielisen uutisarkiston selkouutiset 2011–2018, Korp (kansiossa Selkokieli). Kummastakin aineistosta on kaksi versiota, jotka sisältävät samat virkkeet mutta joilla on erilainen saatavuus ja erilaiset ominaisuudet: Korpiin kirjautuneiden tutkijoiden käytettävissä olevissa versioissa virkkeet ovat alkuperäisessä järjestyksessä ja aineistot tukevat kappalekontekstia, kun taas […]


Dependenssijäsennysten poikkeavuudet korjattu (Suomi24 2017H2, Semfinlex)

27.12.2019

Syyskuussa 2019 huomatut Suomi24 2017H2 -aineiston ja suomenkielisen Semfinlex-aineiston dependenssijäsennysten ja -relaatioiden poikkeavuudet on viimein korjattu (Semfinlex-aineiston osalta jo aiemmin syksyllä). Pahoittelemme virheitä.


Työsuojelusanasto (TSK-35) ja Kelan terminologinen sanasto – Etuuksiin liittyvät käsitteet 4. laitos (TSK-49) latauspalvelussa

20.12.2019

Latauspalvelusta löytyvät nyt seuraavat sanastot: Sanastokeskus TSK ry Työsuojelusanasto (TSK-35) tarkemmat tiedot, linkki aineistoon ja lisenssi löytyvät kuvailutietueesta http://urn.fi/urn:nbn:fi:lb-2017090407 ja Kelan terminologinen sanasto – Etuuksiin liittyvät käsitteet, 4. laitos (TSK-47) tarkemmat tiedot, linkki aineistoon ja lisenssi löytyvät kuvailutietueesta http://urn.fi/urn:nbn:fi:lb-2017090406  


Eduskunnan täysistuntojen päivitetty latausversio 1.5 julkaistu

18.12.2019

Kielipankin Eduskunnan täysistunnot -korpuksesta on nyt saatavilla päivitetty ladattava versio, johon on lisätty saman aineiston Korp-palvelussa näkyvän version 1.5 mukaiset VRT-muotoiset tekstitiedostot tehokäyttäjiä varten. Samasta aineistosta voi edelleen tehdä hakuja kätevästi suoraan Korp-palvelussa.


AI2D-RST saatavilla Kielipankin latauspalvelusta

13.12.2019

Uusi multimodaalinen korpus AI2D-RST (http://urn.fi/urn:nbn:fi:lb-2019120407), joka sisältää 1000 englanninkielistä, peruskoulutason luonnontieteellisiä ilmiöitä kuvaavaa diagrammia, on nyt saatavilla Kielipankin latauspalvelusta: http://urn.fi/urn:nbn:fi:lb-2019120408 Korpus ja sen annotaatio on kuvattu seuraavassa julkaisussa: https://arxiv.org/abs/1912.03879Lisätietoa ja työkaluja korpuksen käyttöön löytyy myös osoitteesta: https://github.com/thiippal/AI2D-RST


Näin viittaat Kielipankissa oleviin aineistoihin

10.12.2019

Aineistoihin viittaaminen on yhtä tärkeää kuin tieteellisiin julkaisuihin viittaaminen! Katso ohjeet: https://www.kielipankki.fi/tuki/viittaa-kielipankkiin-ja-fin-clariniin/


Käännösmuistit Hallituskausi 2007-2011 ja Hallituskausi 2011-2015 latauspalvelussa

10.12.2019

Käännösmuistit Hallituskausi 2007-2011 ja Hallituskausi 2011-2015 saatavilla latauspalvelussa Valtioneuvoston kanslian kieli-ja käännöspalveluyksikön (https://vnk.fi/kaannos-ja-kielipalvelut) avoimina aineistoina julkaisemat käännösmuistit (suomi-englanti) ovat nyt ladattavissa Kielipankin latauspalvelussa korp.csc.fi/download kansiossa hallituskausi. Aineistojen kuvailutiedot: The ”Hallituskausi 2007–2011” Translation Memory. Korpuksen kuvailutiedot: http://urn.fi/urn:nbn:fi:lb-2017090402 The ”Hallituskausi 2011–2015” Translation Memory. Korpuksen kuvailutiedot: http://urn.fi/urn:nbn:fi:lb-2017090403  


Suomenkielinen OpenSubtitles 2017 ja Wikipedia 2017 latauspalvelussa

10.12.2019

Suomenkielinen OpenSubtitles 2017 ja Suomenkielinen Wikipedia 2017 (lähdemateriaalit) latauspalvelussa Korpukset Suomenkielinen OpenSubtitles 2017, lähdemateriaali  ja Suomenkielinen Wikipedia 2017, lähdemateriaali  ovat saatavilla Kielipankin latauspalvelussa korp.csc.fi/download. Suomenkielinen OpenSubtitles 2017 kattaa Opensubtitles.org sivuston jakamat elokuvien ja tv-ohjelmien suomenkieliset tekstitykset. Korpuksen kuvailutiedot: http://urn.fi/urn:nbn:fi:lb-2019110801 Suomenkielinen Wikipedia 2017 kattaa Wikipedian suomenkielisen artikkelien leipätekstit vuoden 2017 lopulta. Korpuksen kuvailutiedot: http://urn.fi/urn:nbn:fi:lb-2019110803 Molemmat muodostavat […]


Kuukauden tutkija: Katri Leino

9.12.2019

Kuukauden tutkija: Katri Leino Kuva: Katri Leino   Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Aalto-yliopiston tutkijakoulutettava Katri Leino kertoo, miten hän hyödyntää tutkimuksessaan Kielipankin aineistoja Ylen suomenkielisen uutisarkiston selkouutiset 2011-2018, lähdemateriaali ja Suomi 24 -korpus. Kuka olet? Olen Katri Leino, tohtorikoulutettava prof. Mikko Kurimon puheentunnistus-ryhmässä Aalto-yliopistossa. Valmistuin 2015 tietoliikennetekniikan […]


Ylen ruotsinkielinen uutisarkisto 2012–2018

9.12.2019

Korpissa on nyt käytettävissä beetatestiversiona Ylen ruotsinkielinen uutisarkisto (Yle svenska webbartiklar) 2012–2018, Korp -aineisto kahtena versiona, jotka sisältävät samat virkkeet mutta joilla on erilainen saatavuus ja erilaiset ominaisuudet: Korpiin kirjautuneiden tutkijoiden käytettävissä olevassa versiossa(kuvailutiedot, aineisto Korpissa) virkkeet ovat alkuperäisessä järjestyksessä ja aineisto tukee kappalekontekstia, kun taas kaikille avoimessa versiossa (kuvailutiedot, aineisto Korpissa) virkkeet on sekoitettu […]


Open Richly Annotated Cuneiform Corpus 2017-09 versio latauspalvelussa

5.12.2019

Open Richly Annotated Cuneiform Corpus 2017-09 versio latauspalvelussa ORACC:n 2017-09 Korp-version vrt-paketti on nyt erikseen ladattavissa Kielipankin latauspalvelusta: http://urn.fi/urn:nbn:fi:lb-2019111602 Korp palvelussa on tällä hetkellä käytettävissä ORACC:n versio toukokuulta 2019: http://urn.fi/urn:nbn:fi:lb-2019060601


Maisteriopiskelijat: Tervetuloa opetusavustajaksi korpuslingvistiikan verkkokurssille tammi-maaliskuussa 2020!

4.12.2019

Nyt on tilaisuus vilkaista kaksikielisen verkkokurssin kulissien taakse! Maisterivaiheen opiskelijat voivat hakea opetusavustajaksi kevään 2020 verkkokurssille Korpuslingvistiikka ja tilastolliset menetelmät 16.12.2019 saakka.


Eduskunnan täysistunnoista julkaistiin uusi versio Korp-palvelussa – mukana lähes kaikki videot

2.12.2019

Kielipankin Korp-palvelussa olevasta Eduskunnan täysistunnot -korpuksesta on nyt saatavilla päivitetty versio, jonka myötä lähes kaikista hakutuloksista pääsee katsomaan ja kuuntelemaan vastaavia puheenvuoroja täysistuntojen alkuperäisissä videotallenteissa.


Kuukauden tutkija: Maija Saviniemi

11.11.2019

Kuukauden tutkija: Maija Saviniemi Kuva: Tero Mononen   Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Oulun yliopiston yliopistonlehtori Maija Saviniemi kertoo, miten hän hyödyntää tutkimuksessaan Kielipankin aineistoa Iijoki, Oulun yliopiston Päätalo-kokoelma, Kielipankki Korp -versio. Kuka olet? Olen Maija Saviniemi, oululainen yliopistonlehtori ja suomen kielen tutkija. Olen väitellyt kielenhuoltodiskursseista vuonna 2015, […]


Kalle Päätalo 100 vuotta: Oulun yliopiston Päätalo-kokoelman Iijoki-sarja julkaistu Kielipankissa

8.11.2019

Oulun yliopiston Päätalo-kokoelman Iijoki-sarja julkaistu Kielipankin Korp-konkordanssipalvelussa   Oulun yliopisto juhlistaa Kalle Päätalon syntymän 100-vuotisjuhlaa järjestämällä 8.11.2019 symposiumin Kalle Päätalo tutkijoiden silmin. Samana päivänä julkaistaan Kielipankissa aineiston Iijoki, Oulun yliopiston Päätalo-kokoelma ensimmäinen versio Iijoki, Oulun yliopiston Päätalo-kokoelma, Kielipankki Korp-versio Kielipankin konkordanssityökalu Korpissa (korp.csc.fi) tutkijoiden käyttöön. Iijoki on kirjailija Kalle Päätalon (11.11.1919-20.11.2000) omaelämäkerrallinen pääteos, jossa kirjailija […]


Tule mukaan Puheen analyysin perusteet -kurssille tai Data Clinic -kurssille!

22.10.2019

Nyt on tilaisuus liittyä mukaan loppusyksyllä alkaville kursseille Puheen analyysin perusteet tai Data Clinic!


Kuukauden tutkija: Viljami Haakana

15.10.2019

Kuukauden tutkija: Viljami Haakana Kuva: Mika Federley   Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Helsingin yliopiston maisterivaiheen opiskelija ja tutkimusavustaja Viljami Haakana kertoo, miten hän hyödyntää Kielipankin aineistoa Lauseopin arkiston murrekorpusta. Kuka olet? Olen Viljami Haakana, kuudennen vuoden yleisen kielitieteen opiskelija Helsingin yliopistossa ja apulaisprofessori Kaius Sinnemäen tutkimusavustaja projektissa, […]


Osallistu Aalto-yliopiston kirjoitustestiin, tuotat samalla tutkimusaineistoa

4.10.2019

Miten nopeasti kirjoitat suomea älypuhelimella tai tietokoneella? Testaa nopeutesi osoitteessa http://kirjoitustesti.aalto.fi/, tuotat samalla tutkimusaineistoa. Testin ideana on kerätä aineisto siitä, miten suomalaiset kirjoittavat älypuhelimillaan. Aineiston avulla Aalto-yliopiston tutkijat pystyvät selvittämään, mitkä asiat kirjoittamisessa sujuvat ja mitkä eivät, ja mikä on nopein tapa kirjoittaa suomen kieltä. Kirjoitustestin laatimisessa on hyödynnetty Kielipankin Suomi24 2017H2-aineistoa ja Ylen suomenkielisen […]


Kuukauden tutkija: Simon Hengchen

16.9.2019

Kuukauden tutkija: Simon Hengchen Kuva: Simon Hengchen   Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Helsingin yliopiston post doc -tutkija Simon Hengchen kertoo Kielipankin aineistolla Kansalliskirjaston sanoma- ja aikakauslehtikokoelman suomenkielinen osakorpus, Kielipankki-versio tekemästään tutkimuksesta. Kuka olet? Olen Simon Hengchen, postdoc-tutkija Helsingin yliopistossa, jossa työskentelen tutkimusryhmässä COMHIS – the Helsinki Computational […]


Workshop Us­ing An­cient Tree­banks: Re­ports and Dreams 20.-21.9.2019

6.9.2019

Workshop Us­ing An­cient Tree­banks: Re­ports and Dreams 20.-21.9.2019 Helsingin yliopisto Porthania P673 (Yliopistonkatu 3, Helsinki)   Puupankit ovat hyödyllisiä nykyaikaisia työkaluja, joilla voimme tutkia kielen syntaksia. Tässä työpajassa käsittelemme puupankkien käyttöä tutkimuksessa ja sellaisten työkalujen kehittämistä, jotka voivat tukea tällaista tutkimusta. Seuraamme työssämme Universal Dependencies (UD) -merkintäjärjestelmän ohjeita ja olemme iloisia saadessamme työpajamme pääpuhujaksi Joakim […]


< Aiemmat uutiset Tuoreemmat uutiset >