Uutisia


Tero Aalto: DeepFin luonnollisen kielen käsittelyn aallonharjalla (blogi)

16.9.2020

DeepFin-projektissa laskettiin miljardien sanojen tekstimassan ja supertietokoneiden avulla uusi FinBERT-malli suomenkielisen tekstin käsittelyyn.


Kuukauden tutkija: Tuomo Hiippala

9.9.2020

Kuukauden tutkija: Tuomo Hiippala Kuva: Veikko Somerpuro   Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Helsingin yliopiston englannin kielen ja digitaalisten ihmistieteiden apulaisprofessori Tuomo Hiippala kertoo, miten hän hyödyntää tutkimuksessaan Kielipankin palveluita. Kuka olet? Olen Tuomo Hiippala, englannin kielen ja digitaalisten ihmistieteiden apulaisprofessori Helsingin yliopiston Kielten osastolla, jossa olen työskennellyt […]


Tero Aalto: Kielipankki palvelee ihmistieteitä (blogi)

26.8.2020

Tekstiä tai puhetta sisältäviä aineistoja kannattaa sijoittaa Kielipankkiin, sillä niitä voidaan hyödyntää laajasti ihmistieteellisessä tutkimuksessa. Kielipankki auttaa tutkijoita välittämään aineistoja ja viittaamaan niihin yhtenäisellä ja pysyvällä tavalla.


Ilmoittaudu uuteen Kielipankki Live -verkkotapahtumaan!

17.8.2020

Ilmoittaudu nyt uuteen Kielipankki Live -verkkotapahtumaan! Kielipankki Live on uusi verkkotapahtumien sarja, jossa haastatellaan tutkijoita ja keskustellaan ajankohtaisista Kielipankkiin liittyvistä aiheista. Tapahtumat videoidaan ja tallenteet ovat katsottavissa jälkikäteen tällä sivulla, myöhemmin myös tekstitettyinä. Ensimmäinen Kielipankki Live -tilaisuus järjestetään maanantaina 24.8. klo 13.00 alkaen. Ilmoittautumalla jo ennakkoon varmistat itsellesi Zoom-kutsulinkin ja saat myös tilaisuuden jälkeen tiedon, […]


Selkokieliset lehdet myös Selkokieli-korpuskansiossa

8.8.2020

Selkokieliset lehdet myös Selkokieli-korpuskansiossa Selkokieliset lehdet Leija ja Selkosanomat/Selkouutiset näkyvät nyt korpusvalikossa myös korpuskansiossa Selkokieli, mikä helpottaa kaikkien selkokieliaineistojen valitsemista. Huomaa, että Leija ja Selkosanomat/Selkouutiset ovat edelleen osa aineistoa 1990- ja 2000-luvun suomalaisia aikakaus- ja sanomalehtiä. Jos ne valitsee sekä osana selkokieliaineistoja että osana muita lehtiä, korpusvalikon otsikkopalkin näyttämä korpusten määrä sisältää ne kahteen kertaan, […]


Kuukauden tutkija: Jenny Tarvainen

3.8.2020

Kuukauden tutkija: Jenny Tarvainen Kuva: Inka Huuskonen   Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Jyväskylän yliopiston tutkimusavustaja Jenny Tarvainen kertoo, miten hän hyödyntää tutkimuksessaan Kielipankin aineistoa Kansainvälinen oppijansuomen korpus, ICLFI. Kuka olet? Olen Jenny Tarvainen. Valmistuin vuoden 2019 tammikuussa Jyväskylän yliopistosta maisteriksi suomen kieli pääaineenani. Tällä hetkellä teen töitä […]


Kuukauden tutkija: Sam Hardwick

2.7.2020

Kuukauden tutkija: Sam Hardwick Kuva: Bess Hardwick Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Helsingin yliopiston projektitutkija Sam Hardwick kertoo, miten hän on ollut mukana tuottamassa Kielipankin työkaluja. Kuka olet? Olen freelance-konsultti, -tutkija ja -ohjelmoija. Urani kieliteknologian parissa alkoi Helsingin yliopistolla HFST-projektissa, jossa kehitettiin ohjelmistoja morfologian mallintamiseen ja sovelluskehitykseen. Niitä […]


CLARIN Café II -virtuaalitapahtuman esitykset: How to use CLARIN in (online) higher education

25.6.2020

CLARIN Café II: How to use CLARIN in (online) higher education Toisen CLARIN ERICin järjestämän CLARIN Café -virtuaalitapahtuman aiheena oli CLARIN-aineistojen ja työkalujen hyödyntäminen korkeakouluopetuksessa. Myös Mietta Lennes FIN-CLARINista piti lyhyen esityksen omasta verkko-opetuksestaan. YouTube-soittolista CLARIN Café II -tapahtuman kaikista esityksistä 10.6.2020 Mietan esitelmä Developing online teaching with materials, exercises and videos in two languages


Lahjoita puhetta -kampanja käynnistyy

16.6.2020

Kielipankki on Ylen ja Vake Oy:n mukana toteuttamassa Lahjoita puhetta -kampanjaa, jossa kerätään puhetta kaikkialta Suomesta, erilaisilta ihmisiltä. Lahjoittamalla puhettasi voit auttaa tutkijoita ja tekoälyä kehittäviä yrityksiä luomaan palveluita, jotka toimivat sujuvammin myös suomeksi.


Agricola-aineistoa päivitettiin keväällä

16.6.2020

Agricola-aineistoa päivitettiin keväällä Agricola-aineistoa päivitettiin pienimuotoisesti keväällä, mutta siitä uutisoiminen jäi Korp-uutisen varaan. Tässä vielä tiedote 30.3. tehdystä päivityksestä tänne Kielipankki.fi:n sivuillekin. Mikael Agricolan teosten morfosyntaktinen tietokanta on päivitetty versioon 1.1, jossa on pieniä korjauksia aiempaan versioon verrattuna: * Osakorpus Piina sisältää 164 sanetta aiempaa enemmän. * Sanan sela perusmuodoksi on korjattu sela. * Muutamien […]


Kuukauden tutkija: Anna Puupponen

8.6.2020

Kuukauden tutkija: Anna Puupponen Kuva: Tapio Laitinen   Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Jyväskylän yliopiston tutkijatohtori Anna Puupponen kertoo, miten hän hyödyntää tutkimuksessaan Kielipankin aineistoja Suomalaisen viittomakielen korpus ja ProGram-aineisto, lumiukko- ja sammakkotarinat. Kuka olet? Olen Anna Puupponen ja työskentelen tutkijatohtorina Jyväskylän yliopiston viittomakielen keskuksessa. Sain väitöskirjani valmiiksi […]


Näin viittaat Kielipankissa olevaan aineistoon

19.5.2020

Tiesitkö, että Kielipankki tarjoaa valmiin viittausohjeen jokaiselle aineistolle? Tarkat tiedot on helppo lisätä julkaisujen lähdeluetteloon!


Kuukauden tutkija: Juhana Salonen

7.5.2020

Kuukauden tutkija: Juhana Salonen Kuva: Hanna-Kaisa Hämäläinen   Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Jyväskylän yliopiston projektituktija Juhana Salonen kertoo, miten hän on ollut mukana tuottamassa Kielipankin aineistoa Suomalaisen viittomakielen korpus. Kuka olet? Olen Juhana Salonen ja työskentelen projektitutkijana Jyväskylän yliopiston viittomakielen keskuksessa. Vastuullani on Suomen kansallisten viittomakielten (suomalainen […]


Tero Aalto: Mitä tutkijan kannattaa tietää pysyvistä tunnisteista (blogi)

27.4.2020

Kaikkein hyödyllisimmälläkään tiedolla ei ole merkitystä, jollei kukaan löydä sitä. Tieteelliselle tiedolle pysyvyys on erityisen tärkeää. Pysyvien tunnisteiden avulla aineistot, julkaisut ja tutkijat löytyvät vuosienkin jälkeen ja saavat ansaitsemansa huomion ja kunnian.


Tero Aalto: Kieliteknologia digitaalisten ihmistieteiden edelläkävijänä (CSC:n blogi)

7.4.2020

Teknologian hyödyntäminen ihmistieteissä ei ole uusi asia, mutta kielentutkimuksella on tällä saralla erityinen etulyöntiase: kieliteknologia, tiede, joka yhdistää kielitieteen ja tietojenkäsittelyn.


Kuukauden tutkija: Mikhail Mikhailov

6.4.2020

Kuukauden tutkija: Mikhail Mikhailov Kuva: Helsingin yliopisto   Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Tampereen yliopiston käännöstieteen professori Mikhail Mikhailov kertoo, miten hän hyödyntää tutkimuksessaan Kielipankkiin tuottamiaan aineistoja ParFin 2016, suomi-venäjä kaunokirjallisten tekstien rinnakkaiskorpus ja ParRus 2016, venäjä-suomi kaunokirjallisten tekstien rinnakkaiskorpus. Kuka olet? Olen Mikhail Mikhailov, Tampereen yliopiston käännöstieteen […]


Suomi24-korpus 2001-2017, VRT-versio 1.1 julkaistu latauspalvelussa

18.3.2020

Suomi24-korpus 2001-2017, VRT-versio 1.1 julkaistu latauspalvelussa Tammikuussa julkaisimme uuden version Suomi24 2017H2 Korp-versiosta nimellä ”Suomi24 virkkeet -korpus 2001-2017, Korp-versio 1.1” ja nyt olemme julkaisseet vastaavan korjatun version myös latauspalvelussa nimellä ”Suomi24-korpus 2001-2017, VRT-versio 1.1”. Uuden version tarkemmat erot suhteessa aikaisemmin latauspalvelussa olleeseen 2017H2 nimiseen aineistoon löytyy tämän uutisen englanninkielisestä versiosta.


Beta-merkintä poistettu Wanca 2016 Korp-versiolta ja lähdemateriaali sekä VRT versiot julkaistu latauspalvelussa

13.3.2020

Beta-merkintä poistettu Wanca 2016 Korp-versiolta ja lähdemateriaali sekä VRT versiot julkaistu latauspalvelussa Wanca 2016 Korp-versio on kokoelma verkkoteksteistä koostettuja virkekorpuksia pienille uralilaisille kielille. Kokoelmassa on 29 virkekorpusta eri kielille. Korpukset on kerätty internetistä käyttäen Suomalais-Ugrilaiset Kielet ja Internet projektissa (SUKI) kehitettyä automaattista järjestelmää. Korp-versio julkaistiin BETAna syksyllä ja nyt BETA-merkintä on poistettu kun joitakin tokenisaatio-ongelmia […]


Kuukauden tutkija: Markus Mattila

7.3.2020

Kuukauden tutkija: Markus Mattila Kuva: Markus Mattila   Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Åbo Akademista valmistunut FM Markus Mattila kertoo, miten hän hyödyntää tutkimuksessaan Kielipankin aineistoa Suomi 24 virkkeet -korpus (2017H2) (beta). Kuka olet? Olen Markus Mattila, viime vuonna Åbo Akademista valmistunut filosofian maisteri suomen kielen ja englannin […]


Suomi24 2001–2017: Korjattu kirjoittajan nimimerkkitietoja

21.2.2020

Suomi24 2001–2017: Korjattu kirjoittajan nimimerkkitietoja Suomi24 2001–2017 -aineistosta on nyt käytössä Korp-versio 1.1, jossa on korjattu kirjoittajan nimimerkkitietoja. Aineistoon on tehty seuraavat muutokset: – Kaikissa viesteissä on kirjoittajan nimimerkki myös vuosina 2009–2012 ja 2014, joilta puuttui aiemmin suuri osa kirjoittajien nimimerkeistä. – Kirjoittajien nimimerkeissä merkit ’, ” ja & ovat nyt sellaisinaan eivätkä muodossa ', […]


< Aiemmat uutiset