Alla oleva teksti oli saatavilla alkuperäisen Lahjoita puhetta -palvelun selainversiossa, valikon kohdassa Tietoa hankkeesta. Alkuperäinen palvelu on poistettu käytöstä 6.3.2024, jolloin teksti on julkaistu uudelleen tällä sivulla.


Tietoa hankkeesta

Lahjoita puhetta -kampanja kerää luonnollista puhetta ja siihen liittyviä tietoja kaikkialta Suomesta, erilaisilta ihmisiltä. Lahjoittamalla puhettasi autat tutkijoita ja tekoälyä kehittäviä yrityksiä ymmärtämään ja mallintamaan suomenkielisen puheen, suomen murteiden ja erilaisten puhetyylien piirteitä. Tavoitteena on kehittää esimerkiksi puheella ohjattavia sovelluksia ja palveluita, jotka toimivat sujuvasti suomeksi.

Puheen lahjoittaminen ja omien taustatietojen ilmoittaminen Lahjoita puhetta -kampanjassa on täysin vapaaehtoista. Kun lahjoitat puhettasi tai muita tietojasi, luovutat samalla Helsingin yliopistolle niihin liittyvät oikeudet. Tämä tarkoittaa, että Helsingin yliopisto voi käyttää ja luovuttaa niitä edelleen kielentutkimukseen sekä tekoälyn tutkimukseen ja kehittämiseen. Ethän lue ääneen tai esitä muiden kirjoittamaa tekstiä, kuten runoja, näytelmien vuorosanoja tai tekstin katkelmia. Nyt saat olla luova!

Lahjoittamaasi puhetta ja muita antamiasi tietoja säilytetään ja käsitellään turvallisesti ja suojatusti. Lahjoitetut puhenäytteet ovat ainoastaan luvan saaneiden tutkijoiden ja kehittäjien käytettävissä. Puhenäytteitä tutkittaessa ei pyritä tunnistamaan yksittäisiä henkilöitä. Koska ihmisen puheääni ja puhetapa on yksilöllinen, aineiston käyttäjä voi sattumalta tunnistaa sinut äänesi tai kertomiesi asioiden perusteella. Aineiston käsittely on kuitenkin luottamuksellista. Voit siis jutella ihan vapaasti! Älä kuitenkaan kerro yksityisiä, arkaluonteisia tai luottamuksellisia asioita itsestäsi tai muista ihmisistä.

Lue lisää tietosuojasta

Mikäli et löydä sivustolta vastausta kysymykseesi tai kohtaat teknisen ongelman, otathan yhteyttä lahjoita-puhetta@kielipankki.fi.

Usein kysytyt kysymykset

Miten lahjoittaminen tapahtuu?

Puhetta lahjoitetaan seuraamalla lahjoituskoneen antamia tehtäviä ja ohjeita. Parhaiten lahjoitus onnistuu mobiilisovelluksella, johon linkin löydät etusivulta.

Mitä puheella oikeastaan tarkoitetaan?

Puheella tarkoitetaan aivan tavallista arkipuhetta kaikkine takelteluineen, epäröinteineen ja taukoineen. Voit puhua aivan kuin puhuisit muutenkin!

Kuka puhetta kerää?

Lahjoita puhetta -kampanja toteutetaan Ylen ja Helsingin yliopiston yhteistyönä. Valtion kehitysyhtiö Vake (nyk. Ilmastorahasto) oli mukana käynnistämässä hanketta vuonna 2020. Yle ja Helsingin yliopisto ovat yhdessä vastuussa puheen keräämisestä, ja Helsingin yliopisto on vastuullinen taho lahjoitetun puheen tallentamisen ja käytön osalta. Mukana ollessaan myös Vake oli vastuussa puheen keräämisestä yhdessä Ylen ja Helsingin yliopiston kanssa. Helsingin yliopisto voi arvionsa mukaan luovuttaa aineistoa muiden käyttöön myös kaupallisesti tai siirtää puheaineiston kokonaisuudessaan jollekin toiselle organisaatiolle. Luovutukset toteutetaan aina Tietosuoja -sivulla esitettyjä periaatteita noudattaen.

Miksi puhetta kerätään?

Puhetta kerätään puhetta ymmärtävien ja tuottavien sovellusten ja palveluiden tutkimuksen ja kehityksen sekä kielentutkimuksen tarpeisiin. Lahjoitetun puheen avulla voidaan kehittää suomea paremmin ymmärtäviä ääniohjattuja sovelluksia hyödynnettäviksi esimerkiksi vanhustenhuollossa. Suomenkielisten sovellusten kehittämiseen tarvitaan kuitenkin valtava määrä ihan tavallista puhetta. Tämän yleishyödyllisen Lahjoita puhetta -kampanjan tavoitteena on varmistaa, että voimme käyttää tulevaisuuden palveluita myös suomeksi, juuri siinä muodossa kuin sitä puhumme. Samalla kielentutkijoiden käyttöön syntyy merkittävä aineisto, jonka perusteella he pystyvät tutkimaan esimerkiksi suomen murteiden nykytilannetta, suomen ääntämistä ja sävelkulkua, erilaisten käsitteiden käyttöä, suomen kielen sanastoa, vuorovaikutuksen ilmiöitä – ja varmasti paljon asioita, joista ei vielä nyt tiedetä mitään!

Miten paljon puhetta on tarkoitus kerätä?

Hankkeen tavoitteena on kerätä yli 10 000 tuntia suomenkielistä arkipuhetta. Tällaisen määrän arvioidaan merkittävästi parantavan esimerkiksi suomenkielisen automaattisen puheentunnistuksen luotettavuutta. Lisäksi halutaan varmistaa, että mukaan saadaan paljon puhetta mahdollisimman erilaisilta ihmisiltä ja eri puolilta Suomea.

Miksi tarvitaan kaikkien suomea puhuvien panosta?

Tarvitsemme mahdollisimman monimuotoista puhuttua suomen kieltä, jotta ääniohjatut laitteet toimisivat kaikilla suomen murteilla ja puhetyyleillä sekä kaikenikäisillä käyttäjillä.

Mitä minä saan, kun lahjoitan puhetta?

Digitalisaation ulottuessa kaikille elämänaloille ja tekoälyn ohjatessa tulevaisuudessa suurta osaa palveluistamme on tärkeää, että teknologia ymmärtää käyttäjiä heidän omilla kielillään. Seurauksena on helpompi tulevaisuuden arki kaikille. Lahjoittaminen on myös hauskaa.

Voinko lahjoittaa puhetta, vaikka äidinkieleni ei ole suomi?

Totta kai! Mitä monipuolisemmin saamme kerättyä suomenkielistä puhetta, sitä hyödyllisempi kertyvä aineisto on tutkimuksen ja puhesovellusten kehityksen kannalta – ja sitä monipuolisemmin tulevaisuuden palvelut ymmärtävät kaikkia meitä suomen puhujia.

Pystyykö äänittämäni puheen poistamaan?

Lahjoituksesi voit poistaa tietokannasta ottamalla yhteyttä osoitteeseen lahjoita-puhetta@kielipankki.fi ja kertomalla heille tunnisteesi sekä ilmaisemalla tahtosi poistaa lahjoituksesi tietokannasta. Löydät selainkohtaisen tunnisteesi Tietosuoja -sivulta. Mobiilisovellusta käytettäessä asennuskohtainen tunnisteesi löytyy Lisätietoa -näkymästä.

Lisäksi aineistoa hallinnoiva taho voi tarvittaessa poistaa puhetallenteita tai muita tietoja.

Pääseekö joku kuuntelemaan lahjoitettua puhettani?

Puhettasi saa kuunnella vain henkilö, joka on perustellusta syystä saanut luvan aineiston käyttämiseen. Yksittäisiä puhenäytteitä voivat kuunnella esimerkiksi puheen litteroijat eli henkilöt, jotka kirjoittavat puheen sanallista sisältöä tekstimuotoon. Puheen rinnalla tarvitaan pohja-aineistona myös suuri määrä puheesta litteroituja sanoja ja lauseita, jotta automaattisia järjestelmiä voitaisiin tehokkaasti opettaa tunnistamaan ja tuottamaan suomea. Yksittäisiä näytteitä saattaa kuunnella myös kielentutkija tai esimerkiksi yrityksessä työskentelevä, puhesovellusta kehittävä henkilö, mikäli näytteen kuunteleminen on tarpeellista tutkimuksen tai puhesovelluksen toiminnan varmistamisen kannalta. Myös tällaisissa tilanteissa aineiston käsittely tapahtuu luottamuksellisesti.

Koska Lahjoita puhetta -kampanjan tavoitteena on kerätä mahdollisimman suuri määrä puhetta, jokaista tekemääsi tallennusta ei välttämättä ole mahdollista kuunnella tai tutkia käsityönä. On todennäköistä, että mahdollisen litterointivaiheen jälkeen puhettasi tuleekin “kuuntelemaan” vain kone.

Voidaanko puheeni julkaista jossain?

Puhettasi voidaan käyttää ainoastaan tieteellisen tutkimuksen ja korkeakouluopetuksen yhteydessä sekä puhesovellusten kehittämisessä. Valmiissa puhesovelluksissa yksittäisen puhujan lahjoittamaa puhetta ei kuitenkaan ole sellaisenaan mukana: alkuperäisiä puhenäytteitä hyödynnetään ainoastaan järjestelmän tai sen toimintaperiaatteen kehittämisessä. Tulevaisuuden puheohjattavasta sovelluksesta ei siis ole mahdollista tunnistaa, kenen puhetta sen tekemiseen on käytetty, eikä myöskään alkuperäistä puhetta voi kuunnella sen kautta. Myöskään Yle ei julkaise puhettasi minkään kanavansa kautta.

Onko tallennettu puheeni biotunniste?

Ihmisen puheääni ja puhetapa ovat yksilöllisiä, joten puhetta voidaan pitää biotunnisteena. Tämä biotunniste on kuitenkin huomattavasti julkisempi kuin esimerkiksi sormenjälkesi tai verkkokalvosi, koska ihmisen puhetta on mahdollista kuulla tai tallentaa lähes kaikissa julkisissa tiloissa. Lahjoita puhetta -kampanjassa kerättävää puheaineistoa ei kuitenkaan käytetä yksittäisen henkilön tunnistamiseen.

Miten henkilötietoja käsitellään?

Lahjoitettu puhe ja muut siihen liittyvät tiedot sisältävät puhujan henkilötietoja. Niiden käsittelyssä noudatetaan Suomessa voimassa olevaa tietosuojalainsäädäntöä. Lisätietoja henkilötietojen käsittelystä löytyy Tietosuoja -sivulta.

Voiko lahjoittamaani puhetta myydä eteenpäin?

Lahjoitettua puhetta hallinnoivat tahot voivat myydä kerättyä puhetta ja siitä kehitettyjä malleja tai litteroitua tekstiä suomalaisille sekä kansainvälisille tutkijoille ja yrityksille suomenkielistä puhetta ymmärtävien ja tuottavien sovellusten ja palveluiden kehittämisen ja tutkimuksen sekä kielentutkimuksen tarpeisiin.

Kuka varmistaa lahjoitetun puheen luottamuksellisen käsittelyn?

Hankkeen takana seisovat luotettavat yhteiskunnalliset toimijat, kuten Yle, Helsingin yliopisto sekä vuoden 2021 helmikuuhun asti myös Valtion kehitysyhtiö Vake (nyk. Ilmastorahasto). Yle ja Helsingin yliopisto ovat yhdessä vastuussa puheen keräämisestä, ja Helsingin yliopisto on vastuullinen taho lahjoitetun puheen tallentamisen ja käytön osalta. Mukana ollessaan myös Vake oli vastuussa puheen keräämisestä yhdessä Ylen ja Helsingin yliopiston kanssa. Helsingin yliopisto voi arvionsa mukaan luovuttaa aineistoa muiden käyttöön myös kaupallisesti tai siirtää puheaineiston kokonaisuudessaan jollekin toiselle organisaatiolle. Luovutukset toteutetaan aina Tietosuoja-sivulla esitettyjä periaatteita noudattaen, ja aineiston käsittely on luottamuksellista.

Miten voin hyödyntää lahjoitettua puhetta omassa tutkimuksessani / omissa liiketoimintasovelluksissamme?

Kerätty puhe päätyy Helsingin yliopiston hallintaan, jonka Kielipankista sitä voidaan luovuttaa edelleen niin tutkijoille kuin yrityksillekin, puhesovellusten kehittämiseen ja tutkimukseen sekä kielentutkimukseen.

Hae Kielipankki-portaalista:
Harri Uusitalo
Kuukauden tutkija: Harri Uusitalo

 

Tulevat tapahtumat


Yhteystiedot

Kielipankin tekninen ylläpito:
kielipankki (ät) csc.fi
p. 09 4572001

Aineistoihin ja muuhun sisältöön liittyvät asiat:
fin-clarin (ät) helsinki.fi
p. 029 4129317

Tarkemmat yhteystiedot