
Tiesitkö, että Kielipankki tarjoaa valmiin viittausohjeen jokaiselle aineistolle? Tarkat tiedot on helppo lisätä julkaisujen lähdeluetteloon!
Kuukauden tutkija: Juhana Salonen Kuva: Hanna-Kaisa Hämäläinen Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Jyväskylän yliopiston projektituktija Juhana Salonen kertoo, miten hän on ollut […]
Kaikkein hyödyllisimmälläkään tiedolla ei ole merkitystä, jollei kukaan löydä sitä. Tieteelliselle tiedolle pysyvyys on erityisen tärkeää. Pysyvien tunnisteiden avulla aineistot, julkaisut ja tutkijat löytyvät vuosienkin jälkeen ja saavat ansaitsemansa huomion ja kunnian.
Teknologian hyödyntäminen ihmistieteissä ei ole uusi asia, mutta kielentutkimuksella on tällä saralla erityinen etulyöntiase: kieliteknologia, tiede, joka yhdistää kielitieteen ja tietojenkäsittelyn.
Kuukauden tutkija: Mikhail Mikhailov Kuva: Helsingin yliopisto Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Tampereen yliopiston käännöstieteen professori Mikhail Mikhailov kertoo, miten hän hyödyntää […]
Suomi24-korpus 2001-2017, VRT-versio 1.1 julkaistu latauspalvelussa Tammikuussa julkaisimme uuden version Suomi24 2017H2 Korp-versiosta nimellä ”Suomi24 virkkeet -korpus 2001-2017, Korp-versio 1.1” ja nyt olemme julkaisseet vastaavan korjatun version myös latauspalvelussa nimellä […]
Beta-merkintä poistettu Wanca 2016 Korp-versiolta ja lähdemateriaali sekä VRT versiot julkaistu latauspalvelussa Wanca 2016 Korp-versio on kokoelma verkkoteksteistä koostettuja virkekorpuksia pienille uralilaisille kielille. Kokoelmassa on 29 virkekorpusta eri kielille. Korpukset […]
Kuukauden tutkija: Markus Mattila Kuva: Markus Mattila Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Åbo Akademista valmistunut FM Markus Mattila kertoo, miten hän hyödyntää […]
Suomi24 2001–2017: Korjattu kirjoittajan nimimerkkitietoja Suomi24 2001–2017 -aineistosta on nyt käytössä Korp-versio 1.1, jossa on korjattu kirjoittajan nimimerkkitietoja. Aineistoon on tehty seuraavat muutokset: – Kaikissa viesteissä on kirjoittajan nimimerkki myös […]
Kielipankin aineistojen viittausohjeisiin on nyt lisätty Google Scholar -hakulinkit, joilla voi kätevästi etsiä aiempia samaan aineistoon liittyviä julkaisuja. Viittausohjeiden noudattaminen kannattaa!
Englantilaisen ja amerikkalaisen kirjallisuuden klassikoita Kersti Juvan suomentamina, englanti–suomi-rinnakkaiskorpus, sekoitettu, Korp on nyt käytettävissä beetatestiversiona Korpissa: kuvailutiedot, aineisto Korpissa. Korpus on tarjolla Korpiin kirjautuneille tutkijoille. Kappaleet on sekoitettu kunkin tekstin […]
Kuukauden tutkija: Anita Nuopponen Kuva: Harri Huusko Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Vaasan yliopiston teknisen viestinnän professori Anita Nuopponen kertoo, miten hän […]
Mietta Lennes esitteli Kielipankkia NexusLinguarum-nimisen COST-hankkeen kokouksessa Prahassa. Täältä löydät myös Kielipankin posterin.
Vuoden 2020 ParlaCLARIN-työpaja pidetään Marseillessa osana LREC2020-konferenssia (Language Resources and Evaluation Conference). Julkaisukutsu on avoinna 14.2.2020 saakka.
Kuukauden tutkija: Emma Sepänaho Kuva: Sofia Tikanmäki Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Helsingin yliopiston maisterivaiheen opiskelija Emma Sepänaho kertoo, miten hän hyödyntää […]
Korpissa on nyt käytettävissä beetatestiversioina aineistot Ylen suomenkielinen uutisarkisto 2011–2018, Korp (Korpin korpusvalikon kansiossa Verkkouutisia) ja Ylen suomenkielisen uutisarkiston selkouutiset 2011–2018, Korp (kansiossa Selkokieli). Kummastakin aineistosta on kaksi versiota, jotka sisältävät […]
Syyskuussa 2019 huomatut Suomi24 2017H2 -aineiston ja suomenkielisen Semfinlex-aineiston dependenssijäsennysten ja -relaatioiden poikkeavuudet on viimein korjattu (Semfinlex-aineiston osalta jo aiemmin syksyllä). Pahoittelemme virheitä.
Latauspalvelusta löytyvät nyt seuraavat sanastot: Sanastokeskus TSK ry Työsuojelusanasto (TSK-35) tarkemmat tiedot, linkki aineistoon ja lisenssi löytyvät kuvailutietueesta http://urn.fi/urn:nbn:fi:lb-2017090407 ja Kelan terminologinen sanasto – Etuuksiin liittyvät käsitteet, 4. laitos (TSK-47) […]
Kielipankin Eduskunnan täysistunnot -korpuksesta on nyt saatavilla päivitetty ladattava versio, johon on lisätty saman aineiston Korp-palvelussa näkyvän version 1.5 mukaiset VRT-muotoiset tekstitiedostot tehokäyttäjiä varten. Samasta aineistosta voi edelleen tehdä hakuja kätevästi suoraan Korp-palvelussa.
Uusi multimodaalinen korpus AI2D-RST (http://urn.fi/urn:nbn:fi:lb-2019120407), joka sisältää 1000 englanninkielistä, peruskoulutason luonnontieteellisiä ilmiöitä kuvaavaa diagrammia, on nyt saatavilla Kielipankin latauspalvelusta: http://urn.fi/urn:nbn:fi:lb-2019120408 Korpus ja sen annotaatio on kuvattu seuraavassa julkaisussa: https://arxiv.org/abs/1912.03879Lisätietoa ja työkaluja korpuksen […]
| < Aiemmat uutiset | Tuoreemmat uutiset > |