9.12.2019

Kuukauden tutkija: Katri Leino

Katri Leino - kuva: Katri Leino
Kuva: Katri Leino

 

Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Aalto-yliopiston tutkijakoulutettava Katri Leino kertoo, miten hän hyödyntää tutkimuksessaan Kielipankin aineistoja Ylen suomenkielisen uutisarkiston selkouutiset 2011-2018, lähdemateriaali ja Suomi 24 -korpus.

Kuka olet?

Olen Katri Leino, tohtorikoulutettava prof. Mikko Kurimon puheentunnistus-ryhmässä Aalto-yliopistossa. Valmistuin 2015 tietoliikennetekniikan diplomi-insinööriksi. Lopputyöni käsitteli puheentunnistimen adoptointia tietylle ympäristölle tai puhujalle. Ihmisten psykologia ja käyttäjän perspektiivi ovat aina kiinnostaneet minua. Halusinkin tuoda tämän kulman myös jatko-opintoihini. Jatkoin valmistumiseni jälkeen tohtoriopintoihin Kurimon ohjauksessa, mutta toisena ohjaajani toimii prof. Antti Oulasvirta, joka johtaa käyttöliittymiin ja käyttäjien mallintamiseen keskittyvää tutkimusryhmää Aalto-yliopistossa. Yhdistän tutkimuksessani kieliteknologiaa ja käyttäjämallintamisen oppeja saadakseni uuden kulman molempien alojen tutkimukseen.

Mikä on tutkimuksen aihe?

Emil Aaltosen säätiön rahoittamassa projektissa tutkin suomenkielisten tapaa kirjoittaa älypuhelimilla. Haluan löytää tapoja helpottaa ja nopeuttaa kirjoittamista, sillä suomalaiset usein kokevat puhelimella kirjoittamisen turhauttavaksi. Kosketusnäppäimistön haastavuuden ja huonon ennustavan tekstinsyötön lisäksi haluan selvittää miten lauseiden sisältö ja vaikeus vaikuttavat kirjoitusnopeuteen ja ovatko syyt kieliriippumattomia.

Keräämme tällä hetkellä kirjoitusnäytteitä selaimessa tehtävällä kirjoitustustestillä: http://kirjoitustesti.aalto.fi (englanninkielinen versio: http://typingtest.aalto.fi/). Testissä kirjoitetaan annettuja lauseita mahdollisimman nopeasti ja tarkasti. Kaikki näppäimistön painallukset aikaleimoineen tallennetaan aineistoksi, joka julkaistaan vuonna 2020. Englanninkielinen aineisto julkaistiin tänä vuonna: https://userinterfaces.aalto.fi/typing37k/. Tavoitteenamme on kerätä näytteitä mahdollisimman monenlaisilta ja monen tasoisilta kirjoittajilta, jotta pystymme tekemään tarkemman analyysin kirjoittamisen haasteista ja onnistumisista.

Miten Kielipankki liittyy tutkimukseen?

Kirjoitustestissä käytettävät lauseet on valikoitu Kielipankin Ylen suomenkielisen uutisarkiston selkouutisista (Ylen suomenkielisen uutisarkiston selkouutiset 2011-2018, lähdemateriaali) ja Suomi 24 -korpuksesta. Selkouutiset tarjosivat yksinkertaisia ja helposti muistettavia lauseita, jotka sopivat kirjoitustestiimme. Halusin perinteisen kirjakielisten uutislauseiden lisäksi myös lauseita, joita ihmiset oikeastikin kirjoittaisivat puhelimillaan. Suomi24 tarjoaa tähän tarkoitukseen sopivaa aitoa puhekieltä.

 

FIN-CLARIN eli suomalaisten yliopistojen, CSC – Tieteen tietotekniikan keskuksen ja Kotimaisten kielten keskuksen muodostama konsortio auttaa humanististen tieteiden tutkijoita käyttämään, jalostamaan, säilyttämään ja jakamaan tutkimusaineistoja. Aineistoja ja työkaluja tarjoaa Kielipankki.

Kaikki toistaiseksi esitellyt Kielipankin käyttäjät löytyvät Kuukauden tutkija -arkistosta. Tämä artikkeli julkaistaan myös Helsingin yliopiston humanistisen tiedekunnan verkkosivuilla.