Muunnellun puheen korpus (avoid)

In English


Saatavilla olevat versiot

LyhenneNimi ja kuvailutiedotLisenssiSijaintiViiteAineistoryhmä ja ohjeHae käyttöoikeuttaJulkaisuvuosiTukitaso
LyhenneNimi ja kuvailutiedotLisenssiSijaintiViiteAineistoryhmä ja ohjeHae käyttöoikeuttaJulkaisuvuosiTukitaso

Tulossa olevat versiot

Nämä aineistoversiot eivät vielä ole saatavilla Kielipankin kautta.

LyhenneNimi ja kuvailutiedotLisenssiMuotoTukitasoYhteyshenkilöSijaintiAineistoryhmä ja ohjeMuu tieto
LyhenneNimi ja kuvailutiedotLisenssiMuotoTukitasoYhteyshenkilöSijaintiAineistoryhmä ja ohjeMuu tieto

Tietoa aineistosta

Korpus koostuu puhenäytteistä, joissa puhujat lukevat tekstiä ääneen joko normaalilla äänellään tai siten, että he pyrkivät kuulostamaan eri-ikäiseltä henkilöltä. Aineisto sisältää näytteet 60 aikuiselta puhujalta (31 naista, 29 miestä), joista jokainen osallistui kahteen äänitykseen. Kummassakin äänityksessä puhuja luki ääneen kaksi suomenkielistä tekstikatkelmaa ja kaksi englanninkielistä virkettä kerran omalla äänellään, kerran teeskentelemällä vanhusta ja kerran teeskentelemällä lasta. Suomenkielisinä teksteinä olivat ”Sateenkaaritarina” ja ”Pohjantuuli ja aurinko”. Englanninkieliset lauseet oli poimittu TIMIT[1]-korpuksesta (SA1, SA2). Aineisto sisältää jokaisen puhujan näytteet 78 eri virkkeestä (66 suomeksi ja 12 englanniksi). Virkkeet on tallennettu yksitellen WAV-muotoisiin äänitiedostoihin. Puhenäytteet äänitettiin samanaikaisesti sekä kannettavalla tallentimella että kahdella älypuhelimella, joten äänitiedostoja on kaikkiaan 14040 kpl (3 * 4680). Aineisto on kerätty kesällä 2015 hankkeessa, jossa tutkittiin teeskentelyn vaikutusta automaattiseen puheentunnistukseen.

Lisenssi ja pääsy aineistoon

  • Tämän aineiston versioihin täytyy hakea erikseen henkilökohtaista käyttöoikeutta (RES).
  • Lisenssikuvaketta napauttamalla näet tarkan aineistokohtaisen lisenssin.
  • Tämän aineiston versioihin voi sisältyä henkilötietoja (lisenssissä on merkintä +PRIV). Lisenssiin voi silloin sisältyä myös erityisiä tietosuojaehtoja, joita sinun on noudatettava. Jos käsittelet henkilötietoja, ylläpidä projektiasi koskevaa julkista tietosuojailmoitusta ja toimita sen linkki Kielipankille, ks. ohjeet.

 

 


Tämän sivun pysyvä tunniste: http://urn.fi/urn:nbn:fi:lb-2025100905

Viimeksi muokattu 2025-10-10