Aineiston nimi: ProoF – Maahanmuuttajien suomen kielen ääntäminen

Aineiston pysyvä tunniste

http://urn.fi/urn:nbn:fi:lb-20140730130

Henkilötietoja sisältävän aineiston käsittelyperuste

Aineiston käsittelyperusteena on 24.5.2018 alkaen yleisen edun mukainen tutkimus.

Rekisterinpitäjä

Helsingin yliopisto

Rekisterinpitäjän yhteyshenkilö

Minnaleena Toivola

Aineiston käsittely

FIN-CLARIN toimii aineiston käsittelijänä.

Aineiston tallentamisesta on alustavasti sovittu FIN-CLARINin kanssa vuonna 2011. Aineiston kopio on luovutettu FIN-CLARINille ja sitä säilytetään suojattuna, kunnes virallinen sopimus aineiston välittämisestä on tehty. Tallennussopimus oli vielä 24.5.2018 tekeillä.

Aineiston luovutusperiaatteet ja käyttöehdot

Aineisto tulee saataville FIN-CLARINin ylläpitämän Kielipankin kautta todennäköisimmin lisenssillä CLARIN RES +NC +PRIV +DEP.

Lisenssin mukaisesti aineistoa tullaan luovuttamaan ainoastaan niiden tutkijoiden käyttöön, jotka ovat esittäneet hyväksyttävän tutkimussuunnitelman ja joille rekisterinpitäjä (tai rekisterinpitäjän määräämä yhteyshenkilö) on myöntänyt määräaikaisen henkilökohtaisen käyttöoikeuden. Käyttöoikeushakemuksen yhteydessä hakijan on hyväksyttävä lisenssin mukaiset käyttöehdot.

Sitten kun aineisto on saatavilla Kielipankissa, aineistokohtaiset käyttöehdot kuvataan erillisellä lisenssisivulla, johon löytyy linkki aineiston kuvailutiedoista sekä Kielipankin aineistoluettelon Lisenssi-sarakkeesta.

Kuvaus aineiston sisältämistä henkilötietoryhmistä

ProoF-aineisto on kerätty erityisesti toisen tai vieraan kielen ääntämisen tutkimista varten niin, että on mahdollista vertailla eri lähtökielille tyypillisiä suomen ääntämisen piirteitä. Aineisto sisältää Suomen Akatemian rahoittamassa hankkeessa kerättyjä teknisesti hyvälaatuisia äänitteitä 72 aikuisen maahanmuuttajan sekä 23 äidinkieleltään suomalaisen verrokkipuhujan puheesta. Mukana on ääneen luettuja suomenkielisiä tekstejä ja lauseita sekä parikeskusteluja, joissa kummallakin puhujalla on edessään hieman toisistaan poikkeavat piirrokset ja tehtävänä on toisen kuvaa näkemättä keskustelemalla selvittää, mitä eroavaisuuksia kuvissa on.

Tehtävien luonteen vuoksi on melko varmaa, ettei aineiston sanallisessa sisällössä ole mitään suoria tai epäsuoria tunnisteita. Ääniaineistoa ei sen sijaan ole mahdollista käsitellä täysin tunnisteettomaksi niin, että se kuitenkin säilyisi tutkimuksen kannalta käyttökelpoisena.

Puhujista on tallennettu aineistoon sukupuoli ja äidinkieli. Osa äänitteistä on litteroitu ja pieneen osaan materiaalista on merkitty vaihtelevalla tarkkuudella myös sanojen ja äänteiden rajat akustis-foneettista tutkimusta varten.

Riskiarvio

24.5.2018 tehdyn arvion perusteella henkilötietojen mahdolliseen paljastumiseen ja väärinkäyttöön liittyvät riskit on arvioitu vähäisiksi. Eksplisiittisinä muuttujina aineistoon on tallennettu vain puhujien äidinkieli ja sukupuoli. Puhujien äidinkielet sinänsä ovat puhujamäärältään suuria, mutta on mahdollista joskaan ei tällä hetkellä kovin todennäköistä, että henkilö pystyttäisiin yksilöimään puheäänensä perusteella. Aineisto ei myöskään suoraan sisällä tietoja, joita voisi sellaisinaan pitää puhujille vahingollisina, ellei heidän lähipiirinsä jostakin syystä suhtaudu tutkimukseen kielteisesti.

Teoriassa puhujan antamat näytteet saattavat sisältää jonkinlaisia teknisin menetelmin pääteltävissä olevia viitteitä puhujien etnisestä taustasta, jolloin osa henkilötiedoista mahdollisesti kuuluisi tietosuoja-asetuksessa tarkoitettuihin ns. erityisiin henkilötietoryhmiin. Puhujien kansallisuuksia tai tarkkoja etniseen taustaan liittyviä henkilötietoja ei kuitenkaan ole rekisterinpitäjän toimesta tallennettu.

Suojatoimet

Aineiston käsittelyssä noudatetaan Kielipankin yleisiä tietosuojakäytänteitä. Pääsy aineistoon on vain määräaikaisen henkilökohtaisen käyttöoikeuden saaneilla tutkijoilla.

Tiedostojen ja hakemistojen nimissä ja aineistosta tehdyissä tekstimuotoisissa litteraateissa tutkittaviin viitataan koodeilla. Koodiavain on yhden rekisterinpitäjän yhteyshenkilön hallussa ja sitä säilytetään suojattuna ja erillään varsinaisesta aineistosta.

Aineiston julkiset kuvailutiedot on anonymisoitu.

Päivitykset

Tämä dokumentti on luotu 24.5.2018 ja sitä päivitetään tarvittaessa.

Hae Kielipankki-portaalista:
Tommi Kurki
Kuukauden tutkija: Tommi Kurki

 

Yhteystiedot

Kielipankin tekninen ylläpito:
kielipankki (ät) csc.fi
p. 09 4572001

Aineistoihin ja muuhun sisältöön liittyvät asiat:
fin-clarin (ät) helsinki.fi
p. 029 4144036 / 029 4129317