Aineiston nimi: Corpus of Age-related Voice Disguise (AVOID)

Aineiston pysyvä tunniste

http://urn.fi/urn:nbn:fi:lb-2018060621

Henkilötietoja sisältävän aineiston käsittelyperuste

Henkilötietojen käsittelyn perusteena on tutkittavien antama suostumus. Tutkittavat saivat kirjallista tietoa tutkimuksesta (ks. liite 1) ja siihen liittyvästä henkilötietojen käsittelystä sekä allekirjoittivat henkilötietojen käsittelyä koskevan suostumuksen (ks. liite 2).

Rekisterinpitäjät

Tomi Kinnunen ja Rosa González Hautamäki

Rekisterinpitäjän yhteyshenkilö(t)

Tomi Kinnunen ja Rosa González Hautamäki, Itä-Suomen yliopisto

Aineiston käsittely

Itä-Suomen yliopistossa aineistoa käsittelevät seuraavat tutkijat: Rosa González Hautamäki, Md Sahidullah, Ville Hautamäki, Maria Bentz, Stefan Werner ja Tomi Kinnunen. Lisäksi aineistoon voi olla tilapäinen pääsy opiskelijalla, jota  henkilökohtaisesti ohjaa joku edellä mainituista.

Rekisterinpitäjä on sopinut FIN-CLARINin Kielipankkia hallinnoivan Helsingin yliopiston kanssa aineiston tallentamisesta. Helsingin yliopisto toimii aineiston käsittelijänä.

Aineiston luovutusperiaatteet ja käyttöehdot

Aineisto on saatavilla Helsingin yliopiston hallinnoiman Kielipankin kautta. Aineistoa luovutetaan edelleen ainoastaan niiden tutkijoiden käyttöön, jotka ovat esittäneet hyväksyttävän tutkimussuunnitelman ja joille rekisterinpitäjä (tai rekisterinpitäjän määräämä yhteyshenkilö) on myöntänyt määräaikaisen henkilökohtaisen käyttöoikeuden. Käyttöoikeushakemuksen yhteydessä hakijan on hyväksyttävä käyttöehdot.

Kun aineisto on julkaistu Kielipankissa, sen käyttöehdot kuvataan erillisellä lisenssisivulla, johon löytyy linkki aineiston kuvailutiedoista sekä Kielipankin aineistoluettelon Lisenssi-sarakkeesta.

Kuvaus aineiston sisältämistä henkilötietoryhmistä

Aineisto sisältää 60 aikuiselta henkilöltä äänitettyjä puhenäytteitä. Puhujien tehtävänä on ollut lukea annetut suomen- ja englanninkieliset tekstit useita kertoja ääneen useilla eri tavoilla: joko normaalilla äänellään tai siten, että he pyrkivät kuulostamaan joko lapselta tai vanhukselta. Teksteinä oli kaksi suomenkielistä tarinaa (Sateenkaaritarina, Pohjantuuli ja aurinko) sekä kaksi englanninkielistä virkettä. Kukin puhuja osallistui äänitykseen kaksi kertaa, joista kummallakin kerralla suoritettiin samat ääneenlukutehtävät.

Ääni- tai videomuotoista aineistoa ei ole mahdollista käsitellä tunnisteettomaksi niin, että se kuitenkin säilyisi tutkimuksen kannalta käyttökelpoisena. Puhujat voi olla mahdollista tunnistaa äänensä perusteella, mutta arkistoitavissa äänitteissä ei suoraan mainita esimerkiksi puhujien nimiä tai muita tunnistetietoja.

Äänitteiden lisäksi aineiston mukana on tallennettu kunkin puhujan ikä äänityshetkellä sekä sukupuoli. Aineiston käyttötarkoituksen kannalta kyseisten tietojen pitkäaikainen säilyttäminen on välttämätöntä.

Riskiarvio

24.9.2018 tehdyn arvion perusteella henkilötietojen mahdolliseen väärinkäyttöön liittyvät riskit on arvioitu pieniksi.

Suojatoimet

Aineiston käsittelyssä noudatetaan Kielipankin yleisiä tietosuojakäytänteitä.

Aineiston julkiset kuvailutiedot on anonymisoitu. Tiedostojen ja hakemistojen nimissä tutkittaviin viitataan koodeilla. Koodiavain on rekisterinpitäjän (yhteyshenkilön) hallussa ja sitä säilytetään erillään varsinaisesta aineistosta.

Ainoastaan tässä dokumentissa mainituilla aineiston käsittelijöillä sekä määräaikaisen henkilökohtaisen käyttöoikeuden saaneilla tutkijoilla on pääsy aineiston sisältämiin puheäänitteisiin ja muihin tunnisteellisiin tietoihin. Pääsy verkkopalvelussa olevaan aineistoon edellyttää tunnistautumista. Aineiston henkilökohtaisen käyttöoikeuden saaneilla tutkijoilla on oikeus käsitellä aineistoa vain käyttöoikeushakemuksessa mainitsemaansa tutkimustarkoitukseen. Jokainen aineistoa käsittelevä on velvollinen noudattamaan sekä Kielipankin yleisiä että aineistokohtaisia käyttöehtoja.

Päivitykset

Tämä dokumentti on luotu 24.9.2018 ja sitä voidaan tarvittaessa päivittää.

Liitteet:

Tutkittaville annettu tutkimusta koskeva informaatio
Tutkittavilta pyydetyn alkuperäisen suostumuksen tekstisisältö (näyte)


Liite 1:

Tutkittaville annettu tutkimusta koskeva informaatio

(Kopio alkuperäisen, tutkittaville annetun tiedotteen tekstisisällöstä)

Sinä olet osallistumassa muokatun puheen datan keräykseen, jonka järjestää tietojenkäsittelytiede, yleisenkielittiede, ja kieliteknologia, Itä-Suomen yliopistosta.

Informaatio tutkimuksesta

Keräämme puhetiedostoja siitä, miten koehenkilö pystyy muuntelemaan ääntään. Tämä kerätty tutkimusmateriaali on hyödyllinen tutkittaessa ääneen perustuvaa tunnistautumista.

Tässä kokeessa sinua pyydetään puhumaan ja lukemaan lauseita omalla äänelläsi ja sitten puhumaan muuntelemalla ääntäsi, jotta kuulostaisit kokonaan eri henkilöltä tai henkilöhahmolta. Äänesi nauhoitetaan mikrofonilla ja älypuhelimilla. Keräämme myös äänihuulten toimintaa elektroglottografin (EGG) kanssa. Tällä laitteella kirjataan äänihuulten värähtelyjen muotoa äänentuoton aikana niin, ettei koehenkilöön kohdisteta mitään invasiivista. Tässä metodissa käytetään elektrodipareja, jotka kiinnitetään koehenkilön kaulaan. EGG:n käyttö on todettu turvalliseksi eikä ole mitään tunnettuja riskejä sen käytön suhteen. 

Yksi äänitystuokio kestää alle 45 minuuttia. Sinua pyydetään osallistumaan ainakin kahteen sessioon. Osallistumisesi tähän tutkimukseen on täysin vapaaehtoista. Jos päätät osallistua ja muutat mielesi myöhemmin, voit peruuttaa osallistumisesi ilman sanktiota milloin vain.

Henkilökohtainen tieto, jota keräämme tutkimuksessamme, on täysin luottamuksellista. Yksityisyyttäsi varjellaan kaikessa tutkimuksesta julkaistavassa materiaalissa. Tässä kokeessa kerätty materiaali säilytetään käytettäväksi myös tulevissa tutkimuksissa.

 


Liite 2:

Tutkittavilta pyydetyn alkuperäisen suostumuksen tekstisisältö (näyte)

Annan suostumukseni siihen, että puheestani tehtyä äänitallennetta voidaan käyttää tutkimusaineistona ja tiedeyhteisön sisäisissä tilaisuuksissa esittelymateriaalina. Aineistoa käsitellään nimettömänä, toisin sanoen tutkimukseen osallistuvien tietosuoja turvataan muuttamalla nimet ja muut tunnistamisen mahdollistavat tiedot julkaistavassa tutkimusmateriaalissa. Aineisto saadaan arkistoida riittävän tietoturvan tason tarjoavaan tieteellisen aineiston arkistoon.

Paikka ja päiväys:

_________________________________________   ____  /  ____  / ___________

__________________________________

Allekirjoitus

Nimen selvennys:

Tätä lupaa allekirjoitetaan kahtena kappaleena, joista toinen jää tutkittavalle. Tämä suostumus voidaan peruuttaa ilmoittamalla asiasta tutkijalle.

 

Hae Kielipankki-portaalista:
Krister Lindén
Kuukauden tutkija: Krister Lindén

 

Tulevat tapahtumat


Yhteystiedot

Kielipankin tekninen ylläpito:
kielipankki (ät) csc.fi
p. 09 4572001

Aineistoihin ja muuhun sisältöön liittyvät asiat:
fin-clarin (ät) helsinki.fi
p. 029 4129317

Tarkemmat yhteystiedot