Kielivaran kuvailutiedot eli metadata

Oletko aikeissa tuottaa uuden kielivaran, jonka haluaisit luovuttaa Kielipankkiin jaettavaksi muiden tutkijoiden kanssa? Tai lojuuko pöytälaatikossasi aineisto, jota voisit antaa muidenkin käyttöön? Jotta tieto aineistostasi löytyisi helposti myös ulkomailta käsin, aineistosta pitää kerätä ainakin keskeisimmät kuvailutiedot (metadata) ja tallentaa nämä julkiseen hakemistopalveluun. Eurooppalainen META-SHARE on rakennettu juuri tähän tarkoitukseen.

Kuvailutiedot META-SHAREen

Kaikista kielivaroista (aineistoista ja työkaluista) kannattaa koota kuvailutiedot META-SHARE-palveluun. META-SHARE-kuvaus vaaditaan kaikilta Kielipankissa julkaistavilta aineistoilta, mutta META-SHAREen voi luetteloida myös muita kielivaroja, joista halutaan tarjota ajantasaiset, julkiset tiedot. FIN-CLARINin tavoitteena on, että jokaisesta suomalaisesta kielivarasta tehdään eurooppalaisten CLARIN- ja META-SHARE-standardien mukainen kuvaus, jota voidaan jaella hakemistopalveluissa myös kansainvälisesti.

FIN-CLARIN vie tärkeimmät tiedot META-SHARE-palveluun puolestasi. Voit lähettää META-SHAREen tarkoitetut tärkeimmät kuvailutiedot sähköpostiosoitteeseen fin-clarin [AT] helsinki.fi. Ilmoita ainakin aineiston nimi, lyhyt kuvaus, aineiston omistajan yhteystiedot, kielet ja koko (esim. montako sanetta, tuntia, tiedostoa tms.) sekä mahdollisesti tiedossasi olevat käyttörajoitukset.

Halutessasi voit itsekin rekisteröityä META-SHAREen kuvailutietojen tuottajaksi ja muokata omien aineistojesi tietoja. Kun haluat julkaista META-SHAREssa tuottamasi kuvailutietueen, ota yhteyttä FIN-CLARINiin.

Aineiston omistajaa/oikeudenhaltijaa on hyvä pyytää tarkistamaan tietojen oikeellisuus. Lupaa kysymättä ei pidä julkaista tietoja muiden omistamista kielivaroista. Varmista myös ensin, ettei kielivaran tietoja jo ennestään löydy META-SHAREsta (tarkista jokin META-SHAREn Suomen ulkopuolella sijaitsevista keskusvarastoista)! Huomaa, että aineisto on voinut aikaisemmin kulkea eri nimellä.

Jos kielivaran tilanne muuttuu, voimme päivittää uudet tiedot META-SHAREen.

Kuvailutietojen julkisuus ja tietosuoja

Huomaa, että META-SHARE-palveluun viedyt kuvailutiedot näkyvät julkisesti koko maailmalle. Julkisen kuvauksen pitää noudattaa henkilösuojalainsäädäntöä, eikä siihen pidä sisällyttää mitään sensitiivistä informaatiota (esim. aineistossa esiintyvien henkilöiden nimiä tai muita tunnistettavia tietoja, potilastietoja tms.). Esimerkiksi puheaineistossa esiintyvät puhujat tulee esittää mahdollisimman yleisesti ryhmänä, josta voidaan yhteisenä kuvailutietona esittää vain joitakin tilastollisia arvioita, esim. karkea ”ikähaitari”.

Julkisen kuvauksen lisäksi voidaan kuitenkin kerätä myös tarkempia kuvailutietoja, jotka voidaan tarvittaessa luovuttaa erikseen vain käyttöoikeuksien haltijoiden rajattuun käyttöön. Tietosuojasta on luonnollisesti huolehdittava myös tässä tapauksessa. Henkilötietojen keräämiseen ja säilyttämiseen on aina pyydettävä kyseisen henkilön lupa.

Jos sinulla on kieliaineistosi kuvailutietojen keräämiseen, esitysmuotoon tai eri formaattien muuntamiseen liittyviä kysymyksiä, ota yhteyttä Jussi Piitulaiseen (FIN-CLARIN) (jussi.piitulainen [AT] helsinki.fi).

Suomalaisen META-SHARE-solmun pääylläpitäjä on Martin Matthiesen (martin.matthiesen [AT] csc.fi).

CLARINin julkaisema komponenttimetadataa koskeva lyhyt opas (ja muut englanninkieliset CLARIN-oppaat)

Hae Kielipankki-portaalista:
Mila OivaKuukauden tutkija: Mila Oiva

 

Yhteystiedot

Kielipankin tekninen ylläpito:
kielipankki (ät) csc.fi
p. 09 4572001

Aineistoihin ja muuhun sisältöön liittyvät asiat:
fin-clarin (ät) helsinki.fi
p. 029 4144036 / 029 4129317