Aineistojen tuottajan ohjeet ja muistilista

Vinkkejä aineistonhallintasuunnitelman tekemiseksi

 1. Kieliaineiston kerääminen
 2. Aikatauluttaminen ja budjetointi
 3. Tarvitaanko FIN-CLARINin apua?
 4. Alustavan käyttöoikeusluokan määrittäminen
 5. Keruuvaiheessa tarvittavat luvat (tekijänoikeus ja lähioikeudet, tietosuoja)
 6. Sopivan tallennusalustan selvittäminen
 7. Aineiston tekninen muoto ja yhteensopivuus
 8. Litterointi ja/tai annotoiminen
 9. Kuvailutietojen eli metadatan koostaminen ja julkaiseminen
 10. Sopivan lisenssin määrittäminen (kokeile CLARINin lisenssiluokitinta)
 11. Tallennussopimus FIN-CLARINin kanssa
 12. Valmiin kielivaran siirtäminen Kielipankkiin saataville

Kerro FIN-CLARINille uudesta kieliaineistosta

Aineiston tuottajan muistilista

Kun suunnittelet kieliaineiston tai muun kielivaran keräämistä ja mahdollista tallennusta Kielipankkiin, tutustu tähän muistilistaan ja siihen liittyviin ohjeisiin.

 • Suunnittele aineiston keruu huolellisesti. Pyri mahdollisimman laadukkaaseen aineistoon. Vaikka aineisto tuotettaisiin vain tiettyä tutkimuskysymystä varten, pidä mielessä, että joku muu tai sinä itse voi myöhemmin haluta käyttää sitä jatkotutkimukseen tai toiseen tutkimustarkoitukseen. Muista kuitenkin, että aineiston ei tarvitse olla ”täydellinen”, vaan on tarkoitus, että muut voivat jatkaa siitä mihin itse jäit.

 • Aikatauluta aineiston koostaminen ja käsittely. Ota realistisesti huomioon esimerkiksi sopimusten valmisteluun ja mahdollisten tutkimuslupien saamiseen kuluva aika. Huomaa, että varsinkin puhekorpusten kohdalla suuri osa annotaatiosta on usein tuotettava käsityönä ja se on siis erittäin aikaavievää. Koko annotaatioprosessia kannattaa kokeilla ensin pienellä osa-aineistolla, jotta voit varmistua menetelmän toimivuudesta ja arvioida siihen kuluvaa aikaa. Aikataulun hahmottaminen on tärkeää jo etukäteen, kun haet projektillesi rahoitusta.

 • Tarvitsetko FIN-CLARINin apua valmiin aineiston siirtämisessä Kielipankkiin? FIN-CLARINilta on mahdollista tilata pienehköjä määriä asiantuntijatyötä ostopalveluna. Huom. Ostopalveluista on aina sovittava FIN-CLARINin kanssa jo ennen hankerahoituksen hakemista.
 • Pohdi alustavasti, mihin käyttöoikeusluokkaan aineisto kuuluu ja millaisella lisenssillä valmista aineistoa voidaan ja halutaan jakaa.
 • Pyydä tarvittaessa lupa aineiston keräämiseen ja käyttämiseen kaikilta aineiston oikeudenhaltijoilta (esim. kirjoittajilta, kustantajilta, puhujilta, haastateltavilta, koehenkilöiltä; huomaa kuitenkin, että henkilötietoja sisältävien aineistojen osalta ei aina enää tarvita suostumusta, mikäli käsittelyperusteeksi voidaan valita yleisen edun mukainen tutkimus). Lupien sisältö ja/tai henkilötiedoille valittu käsittelyperuste määrittävät aineiston käyttöoikeusluokan. Muista siis huolehtia tietosuojasta, mutta pyri sallimaan aineiston mahdollisimman vapaa jakelu. Ota tarvittaessa yhteyttä FIN-CLARINiin – voit kysyä neuvoa lupa- ja sopimustekstien sanamuotojen viimeistelyyn.
 • Pohdi alustavasti, mikä tai mitkä alustat sopivat parhaiten kielivaran käyttämiseen ja jakamiseen. Tällä hetkellä Kielipankki tarjoaa tekstiaineistoille Korp-alustaa. Aineisto voi lisäksi tai vaihtoehtoisesti olla yhtenä tiedostopakettina ladattavissa Kielipankin lataushakemistosta.
 • Varmista, että aineistosi on tekniseltä kannalta oikeassa muodossa.
 • Annotoi aineistosi jotakin suositeltua ohjelmaa ja formaattia käyttäen, jotta annotaatiosta tulee hakukelpoista ja yhteensopivaa. Annotaatio tarkoittaa alkuperäiseen aineistoon, esimerkiksi tekstiin, äänitiedostoon tai videotiedostoon liitettyjä merkkauksia, joka viittaavat alkuperäisen aineiston vastaaviin kohtiin. Järkevän ja systemaattisen annotaation avulla aineistosta voidaan tehdä hakuja ja analyyseja automaattisilla menetelmillä ts. ilman, että aineistoa tarvitsee käsin kahlata läpi.
 • Ryhdy ajoissa keräämään ja koostamaan aineistosi kuvailutietoja eli metadataa.
 • Ota yhteyttä FIN-CLARINiin ja sovi tallennussopimuksen tekemisestä.
 • Kun tallennussopimus on tehty, toimita aineisto sovitussa muodossa FIN-CLARINille, joka käsittelee ja siirtää sen saataville.

Katso, mitä muita kielivaroja on jo matkalla Kielipankkiin

Hae Kielipankki-portaalista:
Krister Lindén
Kuukauden tutkija: Krister Lindén

 

Tulevat tapahtumat


Yhteystiedot

Kielipankin tekninen ylläpito:
kielipankki (ät) csc.fi
p. 09 4572001

Aineistoihin ja muuhun sisältöön liittyvät asiat:
fin-clarin (ät) helsinki.fi
p. 029 4129317

Tarkemmat yhteystiedot