Uutisia


Näin viittaat Kielipankissa olevaan aineistoon

19.5.2020

Tiesitkö, että Kielipankki tarjoaa valmiin viittausohjeen jokaiselle aineistolle? Tarkat tiedot on helppo lisätä julkaisujen lähdeluetteloon!


Kuukauden tutkija: Juhana Salonen

7.5.2020

Kuukauden tutkija: Juhana Salonen Kuva: Hanna-Kaisa Hämäläinen   Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Jyväskylän yliopiston projektituktija Juhana Salonen kertoo, miten hän on ollut mukana tuottamassa Kielipankin aineistoa Suomalaisen viittomakielen korpus. Kuka olet? Olen Juhana Salonen ja työskentelen projektitutkijana Jyväskylän yliopiston viittomakielen keskuksessa. Vastuullani on Suomen kansallisten viittomakielten (suomalainen […]


Tero Aalto: Mitä tutkijan kannattaa tietää pysyvistä tunnisteista (blogi)

27.4.2020

Kaikkein hyödyllisimmälläkään tiedolla ei ole merkitystä, jollei kukaan löydä sitä. Tieteelliselle tiedolle pysyvyys on erityisen tärkeää. Pysyvien tunnisteiden avulla aineistot, julkaisut ja tutkijat löytyvät vuosienkin jälkeen ja saavat ansaitsemansa huomion ja kunnian.


Tero Aalto: Kieliteknologia digitaalisten ihmistieteiden edelläkävijänä (CSC:n blogi)

7.4.2020

Teknologian hyödyntäminen ihmistieteissä ei ole uusi asia, mutta kielentutkimuksella on tällä saralla erityinen etulyöntiase: kieliteknologia, tiede, joka yhdistää kielitieteen ja tietojenkäsittelyn.


Kuukauden tutkija: Mikhail Mikhailov

6.4.2020

Kuukauden tutkija: Mikhail Mikhailov Kuva: Helsingin yliopisto   Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Tampereen yliopiston käännöstieteen professori Mikhail Mikhailov kertoo, miten hän hyödyntää tutkimuksessaan Kielipankkiin tuottamiaan aineistoja ParFin 2016, suomi-venäjä kaunokirjallisten tekstien rinnakkaiskorpus ja ParRus 2016, venäjä-suomi kaunokirjallisten tekstien rinnakkaiskorpus. Kuka olet? Olen Mikhail Mikhailov, Tampereen yliopiston käännöstieteen […]


Suomi24-korpus 2001-2017, VRT-versio 1.1 julkaistu latauspalvelussa

18.3.2020

Suomi24-korpus 2001-2017, VRT-versio 1.1 julkaistu latauspalvelussa Tammikuussa julkaisimme uuden version Suomi24 2017H2 Korp-versiosta nimellä ”Suomi24 virkkeet -korpus 2001-2017, Korp-versio 1.1” ja nyt olemme julkaisseet vastaavan korjatun version myös latauspalvelussa nimellä ”Suomi24-korpus 2001-2017, VRT-versio 1.1”. Uuden version tarkemmat erot suhteessa aikaisemmin latauspalvelussa olleeseen 2017H2 nimiseen aineistoon löytyy tämän uutisen englanninkielisestä versiosta.


Beta-merkintä poistettu Wanca 2016 Korp-versiolta ja lähdemateriaali sekä VRT versiot julkaistu latauspalvelussa

13.3.2020

Beta-merkintä poistettu Wanca 2016 Korp-versiolta ja lähdemateriaali sekä VRT versiot julkaistu latauspalvelussa Wanca 2016 Korp-versio on kokoelma verkkoteksteistä koostettuja virkekorpuksia pienille uralilaisille kielille. Kokoelmassa on 29 virkekorpusta eri kielille. Korpukset on kerätty internetistä käyttäen Suomalais-Ugrilaiset Kielet ja Internet projektissa (SUKI) kehitettyä automaattista järjestelmää. Korp-versio julkaistiin BETAna syksyllä ja nyt BETA-merkintä on poistettu kun joitakin tokenisaatio-ongelmia […]


Kuukauden tutkija: Markus Mattila

7.3.2020

Kuukauden tutkija: Markus Mattila Kuva: Markus Mattila   Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Åbo Akademista valmistunut FM Markus Mattila kertoo, miten hän hyödyntää tutkimuksessaan Kielipankin aineistoa Suomi 24 virkkeet -korpus (2017H2) (beta). Kuka olet? Olen Markus Mattila, viime vuonna Åbo Akademista valmistunut filosofian maisteri suomen kielen ja englannin […]


Suomi24 2001–2017: Korjattu kirjoittajan nimimerkkitietoja

21.2.2020

Suomi24 2001–2017: Korjattu kirjoittajan nimimerkkitietoja Suomi24 2001–2017 -aineistosta on nyt käytössä Korp-versio 1.1, jossa on korjattu kirjoittajan nimimerkkitietoja. Aineistoon on tehty seuraavat muutokset: – Kaikissa viesteissä on kirjoittajan nimimerkki myös vuosina 2009–2012 ja 2014, joilta puuttui aiemmin suuri osa kirjoittajien nimimerkeistä. – Kirjoittajien nimimerkeissä merkit ’, ” ja & ovat nyt sellaisinaan eivätkä muodossa ', […]


Kielipankin aineistoihin liittyviä julkaisuja voi nyt etsiä helposti Google Scholar -palvelusta

17.2.2020

Kielipankin aineistojen viittausohjeisiin on nyt lisätty Google Scholar -hakulinkit, joilla voi kätevästi etsiä aiempia samaan aineistoon liittyviä julkaisuja. Viittausohjeiden noudattaminen kannattaa!


Uusi aineisto (beta): Englantilaisen ja amerikkalaisen kirjallisuuden klassikoita Kersti Juvan suomentamina, englanti–suomi-rinnakkaiskorpus

11.2.2020

Englantilaisen ja amerikkalaisen kirjallisuuden klassikoita Kersti Juvan suomentamina, englanti–suomi-rinnakkaiskorpus, sekoitettu, Korp on nyt käytettävissä beetatestiversiona Korpissa: kuvailutiedot, aineisto Korpissa. Korpus on tarjolla Korpiin kirjautuneille tutkijoille. Kappaleet on sekoitettu kunkin tekstin sisällä. Korpus sisältää seuraavat teokset Kersti Juvan käännöksinä sekä alkuperäisinä: Jane Austen: Ylpeys ja ennakkoluulo (Teos 2013) (Pride and Prejudice) Charles Dickens: Kolea talo (Otava […]


Kuukauden tutkija: Anita Nuopponen

7.2.2020

Kuukauden tutkija: Anita Nuopponen Kuva: Harri Huusko   Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Vaasan yliopiston teknisen viestinnän professori Anita Nuopponen kertoo, miten hän hyödyntää tutkimuksessaan Kielipankin aineistoa Kansalliskirjaston sanoma- ja aikakauslehtikokoelman suomenkielinen osakorpus, Kielipankki-versio. Kuka olet? Olen Anita Nuopponen, teknisen viestinnän professori Vaasa yliopiston markkinoinnin ja viestinnän yksiköstä, […]


Kielipankki esillä NexusLinguarum-hankkeen (COST Action 18209) ensimmäisessä yleiskokouksessa Prahassa

28.1.2020

Mietta Lennes esitteli Kielipankkia NexusLinguarum-nimisen COST-hankkeen kokouksessa Prahassa. Täältä löydät myös Kielipankin posterin.


ParlaCLARIN II -työpaja: Eduskuntatyöskentelyyn ja muuhun poliittiseen keskusteluun liittyvät aineistot

17.1.2020

Vuoden 2020 ParlaCLARIN-työpaja pidetään Marseillessa osana LREC2020-konferenssia (Language Resources and Evaluation Conference). Julkaisukutsu on avoinna 14.2.2020 saakka.


Kuukauden tutkija: Emma Sepänaho

8.1.2020

Kuukauden tutkija: Emma Sepänaho Kuva: Sofia Tikanmäki   Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Helsingin yliopiston maisterivaiheen opiskelija Emma Sepänaho kertoo, miten hän hyödyntää tutkimuksessaan Kielipankin aineistoa 1990- ja 2000-luvun suomalaisia aikakaus- ja sanomalehtiä -korpus, versio 2 . Kuka olet? Olen Emma Sepänaho, neljännen vuoden suomen kielen opiskelija Helsingin […]


Uusia aineistoja (beta): Ylen suomenkielinen uutisarkisto 2012–2018 ja Ylen suomenkielisen uutisarkiston selkouutiset

27.12.2019

Korpissa on nyt käytettävissä beetatestiversioina aineistot Ylen suomenkielinen uutisarkisto 2011–2018, Korp (Korpin korpusvalikon kansiossa Verkkouutisia) ja Ylen suomenkielisen uutisarkiston selkouutiset 2011–2018, Korp (kansiossa Selkokieli). Kummastakin aineistosta on kaksi versiota, jotka sisältävät samat virkkeet mutta joilla on erilainen saatavuus ja erilaiset ominaisuudet: Korpiin kirjautuneiden tutkijoiden käytettävissä olevissa versioissa virkkeet ovat alkuperäisessä järjestyksessä ja aineistot tukevat kappalekontekstia, kun taas […]


Dependenssijäsennysten poikkeavuudet korjattu (Suomi24 2017H2, Semfinlex)

27.12.2019

Syyskuussa 2019 huomatut Suomi24 2017H2 -aineiston ja suomenkielisen Semfinlex-aineiston dependenssijäsennysten ja -relaatioiden poikkeavuudet on viimein korjattu (Semfinlex-aineiston osalta jo aiemmin syksyllä). Pahoittelemme virheitä.


Työsuojelusanasto (TSK-35) ja Kelan terminologinen sanasto – Etuuksiin liittyvät käsitteet 4. laitos (TSK-49) latauspalvelussa

20.12.2019

Latauspalvelusta löytyvät nyt seuraavat sanastot: Sanastokeskus TSK ry Työsuojelusanasto (TSK-35) tarkemmat tiedot, linkki aineistoon ja lisenssi löytyvät kuvailutietueesta http://urn.fi/urn:nbn:fi:lb-2017090407 ja Kelan terminologinen sanasto – Etuuksiin liittyvät käsitteet, 4. laitos (TSK-47) tarkemmat tiedot, linkki aineistoon ja lisenssi löytyvät kuvailutietueesta http://urn.fi/urn:nbn:fi:lb-2017090406  


Eduskunnan täysistuntojen päivitetty latausversio 1.5 julkaistu

18.12.2019

Kielipankin Eduskunnan täysistunnot -korpuksesta on nyt saatavilla päivitetty ladattava versio, johon on lisätty saman aineiston Korp-palvelussa näkyvän version 1.5 mukaiset VRT-muotoiset tekstitiedostot tehokäyttäjiä varten. Samasta aineistosta voi edelleen tehdä hakuja kätevästi suoraan Korp-palvelussa.


AI2D-RST saatavilla Kielipankin latauspalvelusta

13.12.2019

Uusi multimodaalinen korpus AI2D-RST (http://urn.fi/urn:nbn:fi:lb-2019120407), joka sisältää 1000 englanninkielistä, peruskoulutason luonnontieteellisiä ilmiöitä kuvaavaa diagrammia, on nyt saatavilla Kielipankin latauspalvelusta: http://urn.fi/urn:nbn:fi:lb-2019120408 Korpus ja sen annotaatio on kuvattu seuraavassa julkaisussa: https://arxiv.org/abs/1912.03879Lisätietoa ja työkaluja korpuksen käyttöön löytyy myös osoitteesta: https://github.com/thiippal/AI2D-RST


< Aiemmat uutiset