Muunnellun puheen korpus (avoid)

Muunnellun puheen korpus (avoid)

Saatavilla olevat versiot

Lyhenne	Nimi ja kuvailutiedot	Lisenssi	Sijainti	Viite	Aineistoryhmä ja ohje	Hae käyttöoikeutta	Julkaisuvuosi	Tukitaso
Lyhenne	Nimi ja kuvailutiedot	Lisenssi	Sijainti	Viite	Aineistoryhmä ja ohje	Hae käyttöoikeutta	Julkaisuvuosi	Tukitaso

Tulossa olevat versiot

Nämä aineistoversiot eivät vielä ole saatavilla Kielipankin kautta.

Lyhenne	Nimi ja kuvailutiedot	Lisenssi	Muoto	Tukitaso	Yhteyshenkilö	Sijainti	Aineistoryhmä ja ohje	Muu tieto
Lyhenne	Nimi ja kuvailutiedot	Lisenssi	Muoto	Tukitaso	Yhteyshenkilö	Sijainti	Aineistoryhmä ja ohje	Muu tieto

Tietoa aineistosta

Korpus koostuu puhenäytteistä, joissa puhujat lukevat tekstiä ääneen joko normaalilla äänellään tai siten, että he pyrkivät kuulostamaan eri-ikäiseltä henkilöltä. Aineisto sisältää näytteet 60 aikuiselta puhujalta (31 naista, 29 miestä), joista jokainen osallistui kahteen äänitykseen. Kummassakin äänityksessä puhuja luki ääneen kaksi suomenkielistä tekstikatkelmaa ja kaksi englanninkielistä virkettä kerran omalla äänellään, kerran teeskentelemällä vanhusta ja kerran teeskentelemällä lasta. Suomenkielisinä teksteinä olivat ”Sateenkaaritarina” ja ”Pohjantuuli ja aurinko”. Englanninkieliset lauseet oli poimittu TIMIT[1]-korpuksesta (SA1, SA2). Aineisto sisältää jokaisen puhujan näytteet 78 eri virkkeestä (66 suomeksi ja 12 englanniksi). Virkkeet on tallennettu yksitellen WAV-muotoisiin äänitiedostoihin. Puhenäytteet äänitettiin samanaikaisesti sekä kannettavalla tallentimella että kahdella älypuhelimella, joten äänitiedostoja on kaikkiaan 14040 kpl (3 * 4680). Aineisto on kerätty kesällä 2015 hankkeessa, jossa tutkittiin teeskentelyn vaikutusta automaattiseen puheentunnistukseen.

Lisenssi ja pääsy aineistoon

Tämän aineiston versioihin täytyy hakea erikseen henkilökohtaista käyttöoikeutta (RES).
Lisenssikuvaketta napauttamalla näet tarkan aineistokohtaisen lisenssin.
Tämän aineiston versioihin voi sisältyä henkilötietoja (lisenssissä on merkintä +PRIV). Lisenssiin voi silloin sisältyä myös erityisiä tietosuojaehtoja, joita sinun on noudatettava. Jos käsittelet henkilötietoja, ylläpidä projektiasi koskevaa julkista tietosuojailmoitusta ja toimita sen linkki Kielipankille, ks. ohjeet.

Tämän sivun pysyvä tunniste: http://urn.fi/urn:nbn:fi:lb-2025100905

Viimeksi muokattu 2025-10-10