14.8.2024

In English

Kuukauden tutkija: Tuukka Törö

Tuukka Törö
Kuva: Riina Kiianmies

Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Tuukka Törö kertoo meille suomenkieliseen puhesynteesiin liittyvästä tutkimuksestaan. Neuroverkkomallit, joiden kouluttamiseen on tarvittu laajoja, monipuolisia puheaineistoja, mahdollistavat tutkijoille uudenlaisia analysointikeinoja.

Kuka olet?

Olen Tuukka Törö, väitöskirjatutkija. Olen työskennellyt Helsingin yliopiston Fonetiikan ja puhesynteesin tutkimusryhmässä tämän vuoden alusta lähtien. Taustani on kielitieteessä ja fonetiikassa, ja olen valmistunut englannin kielen kandidaatiksi Malmön yliopistosta sekä fonetiikan maisteriksi Helsingin yliopistosta. Kun olin saanut valmiiksi maisterintutkielmani, jossa aiheena oli puhesynteesin puhetyylien hallinta, työskentelin jonkin aikaa Ylellä tekoälyradiohankkeissa, joissa loimme synteettisiä ”näyttelijöitä” radio-ohjelmiin.

Tällä hetkellä työskentelen Suomen Akatemian rahoittamassa Predictive Processing Approach to Modelling Prosodic Hierarchy for Speech Synthesis -hankkeessa. Hankkeen tavoitteena on kehittää tekstistä puheeksi -synteesiä (TTS), jonka lähtökohtana on ihmiskognitiota mallintava ennakoivan prosessoinnin teoria.

Vaikka olenkin siirtynyt enemmän tekniseen suuntaan, työni taustalla näkyy kiinnostukseni siihen, millä tavoin sosiaaliset rakenteet vaikuttavat puheeseen, makrotason vaihtelusta aina yksilöiden tilannekohtaisesti välittämään sosiaaliseen dynamiikkaan.

Mikä on tutkimuksesi aihe?

Tällä hetkellä tutkin makrotason kielen vaihtelua TTS-synteesiä ja puheentunnistusta varten rakennettujen neuroverkkomallien avulla. Vaikka mallien alkuperäinen käyttötarkoitus on teknisissä sovelluksissa, voimme niiden avulla analysoida puhetta uusilla tavoilla. Koska mallit on koulutettu suurilla määrillä äänidataa, voidaan niillä mallintaa laadultaan vaihtelevaa ”villiä” dataa laajassa mittakaavassa sen sijaan, että analysoitaisiin tiettyjä akustisia piirteitä pienistä, ammattimaisesti äänitetyistä aineistoista.

Akatemiahankkeessa tavoitteeni on yhdistää sosiolingvistinen vaihtelu ennakoivan prosessoinnin ja puhesynteesin kanssa. Toivon mukaan tulevina vuosina voisimme oppia jotain uutta siitä, miten ihmiset havaitsevat puheen sosiaalisia vihjeitä ja millä tavoin korkean tason sosiaalisia ennusteita voitaisiin hyödyntää puhesynteesin kehittämisessä.

Miten Kielipankki liittyy tutkimukseesi?

Käytän usein Kielipankin aineistoja, kuten SKN-korpusta (Suomen kielen näytteitä), FinSyniä (tulossa saataville Kielipankkiin) ja ennen kaikkea Lahjoita puhetta -aineistoa. Jotta voisimme kouluttaa puhesyntetisaattoreita, joita säädetään sosiaalisten muuttujien – kuten iän, sukupuolen ja murteen – perusteella, tarvitsemme suuren määrän äänidataa eri taustoista tulevilta ihmisiltä. Koska suomi on suhteellisen pieni kieli, on erityisen tärkeää, että Lahjoita puhetta -korpuksen kaltaisten suurten aineistojen kokoamiseen panostetaan keskitetysti.

Viimeaikaisia julkaisuja

Törö, T., Suni, A. and Šimko, J. (2024). Analysis of regional variants in a vast corpus of Finnish spontaneous speech using a large-scale self-supervised model, Proceedings of Speech Prosody 2024, Leiden, Netherlands. DOI: 10.21437/SpeechProsody.2024-8

Šimko, J., Törö, T., Vainio M., and Suni, A. (2023). Prosody under control: Controlling prosody in text-to-speech synthesis by adjustments in latent reference space, Proceedings of the 18th International Congress of Phonetic Sciences, Prague, Czech Republic. http://hdl.handle.net/10138/565382

Muita töitä

Aineistoja

FIN-CLARIN eli suomalaisten yliopistojen, CSC – Tieteen tietotekniikan keskuksen ja Kotimaisten kielten keskuksen muodostama konsortio auttaa ihmistieteiden tutkijoita käyttämään, jalostamaan, säilyttämään ja jakamaan tutkimusaineistoja. Aineistoja ja työkaluja tarjoaa Kielipankki.

Kaikki tähän saakka esitellyt Kielipankin käyttäjät löytyvät Kuukauden tutkija -arkistosta. Tämä artikkeli julkaistaan myös Helsingin yliopiston humanistisen tiedekunnan verkkosivuilla.