DELAD FIN-jaoston muistiinpanoja

1.6.2021 9-10

Mietta, Martin & Satu

Update: 

Martin osallistuu projektiin (Gaia-X), jossa keskitytään datan turvalliseen jakamiseen kansainvälisessä yritysyhteistyössä.  

Satun opiskelija on analysoinut ultraääniaineiston (N=4, joista 3 antanut luvan datan jakamiseen) ja saanut lupaavia tuloksia perkeptuaalisella analyysilla, joka toteutettu HY:n turvallisella verkkoasemalla. Mahdollisesti julkaisu tulossa, minkä vuoksi tämä datasetti olisi kuitenkin hyvä pilotti sensitiivisen aineiston jakamiseen DELADissa. 

Potentiaalinen Use case: 

Jo tehdyt analyysistepit pyrittäisiin toistamaan remote desktop -ympäristössä, joka olisi turvallinen sensitiivisen aineiston käsittelyyn. 

  • Videoaineisto waviksi (osa aineistosta jo valmiina wav-muodossa, osassa täytyy erottaa videosta)
  • erotellaan sanat
  • erolellaan /r/-äänteet
  • Kysymyksiä: miten saa Umpiosta (HY:n säilö) turvallisesti altaaseen ja voiko käyttää esim PRAATia ja valmiita MATLAB skriptejä. 

Mietan jälkilisäys:

FIN-CLARIN on työstänyt hyvän juristin tuella myös sopimusmenettelyä henkilötietoja sisältävien aineistojen suhteen. 

  • Meillä on melkein valmis tallennussopimuspohja, jolla voidaan sopia aineiston luovutuksesta Kielipankkiin ja todeta, siirtyykö myös rekisterinpitäjyys aineiston säilytyksen ja edelleen välittämisen osalta Kielipankille (=Helsingin yliopistolle) vai toimiiko Kielipankki vain käsittelijänä rekisterinpitäjän ohjeiden mukaan. 
    • Tämän DELAD-aineiston osalta Helsingin yliopisto on jo alunperinkin rekisterinpitäjä, mutta sopimuksella voidaan joka tapauksessa todeta aineistoon liittyvät tietosuojaehdot.
  • Tallennussopimuksen liitteessä määritellään aineiston lisenssi ja henkilötietoja sisältävien aineistojen osalta lisäksi erikseen aineistokohtaisesti noudatettavat tietosuojaehdot, jotka aineistoa vastaanottava tutkija joutuu hyväksymään ennen käsittelyn aloittamista.
  • Kun aineisto on Kielipankissa, sillä on lisenssi, jonka yhtenä lisäehtona näkyy
    “PRIV: Aineisto sisältää henkilötietoja. Käyttäjä saa käsitellä aineistoa vain niin kauan, kuin sillä on käsittelyyn lainmukainen peruste, minkä jälkeen henkilötiedot on poistettava.”
  • PRIV-ehdon kohdalla näytetään myös linkki “Aineistokohtaiset tietosuojaehdot”, josta käyttäjä löytää kuvauksen henkilötietoryhmistä ja niiden käsittelyyn liittyvistä erityisistä vaatimuksista (myös esim. onko käsittely ETA-maiden ulkopuolella luvallista jne.). Tietosuojaehdot sitovat jokaista käyttäjää.