13.2.2026

Kuukauden tutkija: Kalle Lahtinen

In English

Kalle Lahtinen
Kuva: Antti Yrjönen

Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Kalle Lahtinen kertoo meille tutkimuksestaan, jossa hän tarkastelee kielellistä affektia ja puhe-emootiota spontaanin suomen kielen kontekstissa.

Kuka olet?

Olen Kalle Lahtinen ja toimin väitöskirjatutkijana Tampereen yliopiston signaalinkäsittelyn tutkimuskeskuksessa. Ennen jatko-opintojani olen opiskellut tietotekniikkaa, signaalinkäsittelyä, akustiikkaa ja matematiikkaa. Väitöstyötäni ohjaavat professori Okko Räsänen ja vanhempi yliopistonlehtori Liisa Mustanoja Tampereen yliopistosta sekä vanhempi yliopistonlehtori Juraj Šimko Helsingin yliopistosta.

Mikä on tutkimuksesi aihe?

Väitökseni aihe on Kielellinen affekti ihmisen ja koneen tulkitsemana. Tutkin kielellistä affektia ja puhe-emootiota spontaanin suomen kielen kontekstissa. Spontaanilla tarkoitan ei-näyteltyä, ilmaisutyyliltään ohjaamatonta (arki)puhetta. Hyödynnän työssäni sekä puhuttua että kirjoitettua kieltä. Tarkastelen, miten puheen merkityssisältö (mitä sanottiin) ja vastaava akustinen signaali (miten sanottiin) vaihtelevat, liittyvät toisiinsa ja vaikuttavat ilmaisun tulkintaan kokonaisuutena.

Työssäni tarkastelen suuria kieliaineistoja signaalinkäsittelyn ja koneoppimisen avulla. Väitöstyö tuottaa uusia aineistoja ja menetelmiä kielellisen affektin analyysiin ja mallintamiseen niin, että huomioiduksi tulevat sekä puhekielen yksilöllinen että tilanteellinen vaihtelu. Tulokset vievät sekä kielentutkimusta että puheteknologista sovelluskehitystä eteenpäin.

Työni on osa Tampereen yliopiston poikkitieteellistä CONVERGENCE of Humans and Machines -hanketta, jonka rahoittajana toimii Jane ja Aatos Erkon säätiö.

Miten Kielipankki liittyy tutkimukseesi?

Väitöstutkimukseni ensimmäisen vaiheen aikana koostettu spontaanin suomen kielen affektikorpus FinnAffect julkaistaan Kielipankissa. Korpus on koostettu Lahjoita puhetta, Helpuhe ja Tampuhe -aineistoista (jotka myös ovat joko jo saatavilla tai tulossa saataville Kielipankkiin). FinnAffect-korpus koostuu 1 474 728:sta 1–20 sekuntia pitkästä litteroidusta puhunnosta, joista 12 000 on annotoitu tunnesävyn ja virittyneisyyden suhteen. Aineistossa on tuhansien erilaisten ihmisten puhetta ja on siten kielellisen affektin tutkimisen suhteen ensimmäinen laatuaan Suomessa. FinnAffect-korpuksen koostamisen ja julkaisemisen mahdollistivat Kielipankkiin jo tallennetut laajat puhutun kielen aineistot sekä tietysti Kielipankin tarjoama asiantunteva palvelu.

Julkaisut

Lahtinen, K., Vaaras, E., Mustanoja, L., Räsänen, O. (2025). Investigating affect mining techniques for annotation sample selection in the creation of Finnish affective speech corpus. Interspeech 2025, 3958-3962. DOI: https://doi.org/10.21437/interspeech.2025-687

Lahtinen, K., Mustanoja, L., Räsänen, O. (2025). FinnAffect: An affective speech corpus for spontaneous Finnish. Speech Communication 175, 103327–. DOI: https://doi.org/10.1016/j.specom.2025.103327

Aineistoja

FIN-CLARIN eli suomalaisten yliopistojen, CSC – Tieteen tietotekniikan keskuksen ja Kotimaisten kielten keskuksen muodostama konsortio auttaa ihmistieteiden tutkijoita käyttämään, jalostamaan, säilyttämään ja jakamaan tutkimusaineistoja. Aineistoja ja työkaluja tarjoaa Kielipankki.

Kaikki tähän saakka esitellyt Kielipankin käyttäjät löytyvät Kuukauden tutkija -arkistosta. Tämä artikkeli julkaistaan myös Helsingin yliopiston humanistisen tiedekunnan verkkosivuilla.

 

Hae Kielipankki-portaalista:

Mastodon