
| Lyhenne | Nimi ja kuvailutiedot | Lisenssi | Sijainti | Viite | Aineistoryhmä ja ohje | Hae käyttöoikeutta | Julkaisuvuosi | Tukitaso |
|---|---|---|---|---|---|---|---|---|
| Lyhenne | Nimi ja kuvailutiedot | Lisenssi | Sijainti | Viite | Aineistoryhmä ja ohje | Hae käyttöoikeutta | Julkaisuvuosi | Tukitaso |
Nämä aineistoversiot eivät vielä ole saatavilla Kielipankin kautta.
| Lyhenne | Nimi ja kuvailutiedot | Lisenssi | Muoto | Tukitaso | Yhteyshenkilö | Sijainti | Aineistoryhmä ja ohje | Muu tieto |
|---|---|---|---|---|---|---|---|---|
| Lyhenne | Nimi ja kuvailutiedot | Lisenssi | Muoto | Tukitaso | Yhteyshenkilö | Sijainti | Aineistoryhmä ja ohje | Muu tieto |
Korpus koostuu puhenäytteistä, joissa puhujat lukevat tekstiä ääneen joko normaalilla äänellään tai siten, että he pyrkivät kuulostamaan eri-ikäiseltä henkilöltä. Aineisto sisältää näytteet 60 aikuiselta puhujalta (31 naista, 29 miestä), joista jokainen osallistui kahteen äänitykseen. Kummassakin äänityksessä puhuja luki ääneen kaksi suomenkielistä tekstikatkelmaa ja kaksi englanninkielistä virkettä kerran omalla äänellään, kerran teeskentelemällä vanhusta ja kerran teeskentelemällä lasta. Suomenkielisinä teksteinä olivat ”Sateenkaaritarina” ja ”Pohjantuuli ja aurinko”. Englanninkieliset lauseet oli poimittu TIMIT[1]-korpuksesta (SA1, SA2). Aineisto sisältää jokaisen puhujan näytteet 78 eri virkkeestä (66 suomeksi ja 12 englanniksi). Virkkeet on tallennettu yksitellen WAV-muotoisiin äänitiedostoihin. Puhenäytteet äänitettiin samanaikaisesti sekä kannettavalla tallentimella että kahdella älypuhelimella, joten äänitiedostoja on kaikkiaan 14040 kpl (3 * 4680). Aineisto on kerätty kesällä 2015 hankkeessa, jossa tutkittiin teeskentelyn vaikutusta automaattiseen puheentunnistukseen.
Tämän sivun pysyvä tunniste: http://urn.fi/urn:nbn:fi:lb-2025100905
Viimeksi muokattu 2025-10-10