LAT-ohjeet: ELAN

ELAN on ohjelma, jolla voi litteroida ja annotoida ääni- ja videotiedostoja. ELANilla tallennettava tiedostomuoto on EAF (*.eaf).

Tarkemmat englanninkieliset ohjeet: http://tla.mpi.nl/tools/tla-tools/elan/

Ääni- ja/tai videotiedoston annotoiminen ELANilla (pikaohje)

  1. Avaa ELAN-ohjelma.
  2. Aloita uusi annotaatiotiedosto: Valitse New… ja Add media file… Etsi ja valitse koneelta ne äänitiedostot ja/tai videotiedostot, jotka liittyvät samaan litteroitavaan tilanteeseen ts. joilla on yhteinen aikajana.
  3. Annotaationäkymä avautuu. Oletusarvoisesti luodaan vain yksi, default-niminen annotaatiokerros (tier). Voit muuttaa kerroksen nimen sopivammaksi komennolla Tier: Change Tier Attributes… Valitse pudotusvalikosta muokattava kerros (esim. default). Anna uudelle kerrokselle sopiva nimi (Tier name) ja paina alareunasta Change. Paina lopuksi Close.
  4. Jos tarvitset useampia kerroksia (esim. jos näytteessä esiintyy useampia puhujia), voit luoda niitä lisää komennolla Tier: Add New Tier… (tai painamalla edellisen kohdan ikkunassa tabia ”Add”). Anna uudelle kerrokselle sopiva nimi (Tier name). Paina Add, jolloin uusi kerros tulee näkyviin. Paina lopuksi Close.
    • Älä käytä annotaatiokerrosten tai tiedostojen nimissä esim. puhujien nimikirjaimia tai muita henkilöllisyyteen viittaavia tunnistetietoja! Saman korpuksen sisällä esiintyvät puhujat kannattaa mieluummin koodata esimerkiksi juoksevalla kirjain-numerokoodilla. Jos on tärkeää erottaa vaikkapa mies- ja naispuhujat toisistaan, voidaan merkitä miespuhujat esim. koodeilla M1, M2, M3… M100, tai vaihtoehtoisesti M01–M10; naiset F1, F2, F3… F100 tms. Näin puhujat voidaan yksilöidä korpuksen sisällä, mutta henkilötietojen ei-toivottu julkinen näkyminen vältetään.
    • Kerroksen nimessä kannattaa viitata siinä annotoitavien yksiköiden tyyppiin sekä ko. kerroksessa esiintyvään puhujaan (vaikkapa ”F1-utterance”,”M4-left_hand”).
    • Mikäli aiot tehdä hyvin monimutkaista ja monikerroksista annotaatiota, tutustu ELANin käyttämiin ”lingvistisiin tyyppeihin”, joilla voidaan tarkasti määritellä annotaatiokerrosten välisiä suhteita ja merkityksiä (ks. englanninkielinen manuaali). Tarkasti tyypitetyt kerrokset auttavat hakuvaiheessa. Esim. jos kaikki puhekielisiä saneita kuvaavat annotaatiokerrokset on merkitty lingvistisellä tyypillä ”word”, voidaan haku kohdistaa kerralla koko korpuksen kaikkiin ”word”-tyyppisiin kerroksiin.
  5. ”Yleiset” soittopainikkeet ovat vasemmalla annotaatiokerrosten yläpuolella. Valittuna olevaa aluetta tai annotaatioyksikköä voi kuunnella vaaleansinisellä S-soittopainikkeella (keskellä ikkunaa). Ruksaa päälle Loop mode, jos haluat toistaa pätkää loputtomasti!
  6. Etsi annotoitavan pätkän karkeat alkamis- ja päättymiskohdat valitsemalla hiirellä pätkiä äänestä ja kuuntelemalla niitä. Mikäli olet liittänyt annotaatiotiedostoosi WAV-muotoisen äänitiedoston, näkyy annotaatiokerrosten yläpuolella myös äänen aaltomuoto, jota voit käyttää hyväksi esim. kun rajaat puhetta vs. taukoja. Aaltomuotokuvaajaa voi hieman suurentaa pystysuunnassa, jotta näkymä on tarkempi. (Aaltomuodon ylä- ja alapuolella keskellä ikkunaa on ”kahvat”, joista ko. osiota voi venyttää.)
  7. Jos olet liittänyt annotaatiodokumenttiin videotiedoston, videokuva tulee näkyviin omaan osioonsa. Jos haluat, että video näkyy erillisessä ikkunassa, klikkaa videota oikealla napilla ja valitse Detach. Jos haluat videon takaisin annotaatioikkunaan, klikkaa oikealla napilla ja valitse Attach.
    • Jos video ei tule näkyviin, vaikka olet liittänyt sen annotaatiodokumenttiin, koneesi ei ehkä tue ko. tiedoston videoformaattia. ELAN käyttää hyväkseen kyseisellä koneella ennestään olevia videorajapintoja, esim. Windows Media Playeria ja/tai Quicktimea, joten näiden on syytä olla asennettuina. ELANissa ei siis ole sisäänrakennettua tukea eri videoformaateille. Videoiden toimivuus kannattaa siis varmistaa esim. ennen esitystilanteita, ja oman korpuksen päävideoformaatiksi on syytä valita jokin mahdollisimman yleisessä käytössä oleva muoto.
  8. Uuden puhunnoksen (tai muun annotaatioyksikön) voi luoda ”maalaamalla” hiirellä pätkän äänitiedoston kuvaajasta (annotaatiokerrosten yläpuolella) ja kaksoisklikkaamalla valittua aluetta halutun annotaatiokerroksen kohdalla. Näkyviin tulee valkoinen laatikko, johon voi kirjoittaa tekstiä. Tekstin muokkaus hyväksytään painamalla Ctrl-Enter. (Huom. Jos tämä tuntuu pitemmän päälle hankalalta, hyväksymisnäppäimen voi muuttaa Elanin asetuksista.)
  9. Kaksoisnäpäytys avaa annotaation tekstin uudelleen muokattavaksi.
  10. Jos haluat siirtää olemassaolevan annotaatioyksikön rajoja, paina Alt-näppäin pohjaan ja tartu hiirellä annotaation alku- tai loppurajaan. Vedä ja pudota. Voit myös tarttua annotaation keskelle ja siirtää koko annotaatiota eteen- tai taaksepäin.
  11. Tallenna Save-komennolla. Annotaatiot tallentuvat .eaf-tiedostoon.

Huom. Annotaatiotiedosto sisältää linkit ääni- ja videotiedostoihin, joten ne on periaatteessa siirrettävä .eaf-tiedoston mukana. Mikäli .eaf-tiedosto avataan koneella, jossa kyseiset mediatiedostot eivät ole oletetussa paikassa, ELAN pyytää aluksi käyttäjää paikallistamaan ko. tiedostot koneeltaan. Hyvä tapa on säilyttää mediatiedostot kaikilla koneilla esim. samassa hakemistossa tai tietynnimisessä alihakemistossa kuhunkin .eaf-tiedostoon nähden.

Foneettisten merkkien tms. symbolien käyttäminen annotaatiossa

Vinkkejä ELAN-ohjelman asetuksiin

  • ELAN saattaa joskus tuntua hitaalta. Ohjelman kehittäjän (Han Sloetjes, MPI) mukaan tilanne saattaa helpottua muuttamalla näytön piirtoasetusta ELANissa koneen käyttöjärjestelmän mukaan (ainakin ELAN-versiossa 4.7.2 ja aiemmissa). Valitse Edit Preferences: User Interface ja muuta kohtaa “Painting strategy” seuraavasti:
    • Mac OS: Paint to buffer first
    • Windows: Paint directly to the screen

Annotaatioiden vienti ja tuonti eri formaateista

Annotaation tallentaminen perinteisenä tekstimuotoisena litteraattina

ELANilla tuotetusta monikerroksisesta annotaatiosta voi milloin tahansa tuottaa perinteisen, helposti luettavan tekstitiedoston esimerkiksi komennolla Export As:Traditional Transcript Text… tai Interlinear Text…. Etuna on, että mm. taukojen kestot ja annotaatioiden alkamisajat voidaan kerätä annotaatioista automaattisesti ja halutulla tarkkuudella.

Huom. Myös Praat-ohjelmalla tehdystä annotaatiosta voidaan tuottaa tekstimuotoinen keskustelulitteraatti käyttämällä skriptiä, katso ohjeet.

Annotaatioiden tuominen muista ohjelmista ELANiin

ELANiin voi tuoda myös muilla ohjelmilla (esim. Praat, Transcriber) tuotettuja annotaatiokerroksia (engl. tier). Samalla kerrosten sisältämien annotaatioyksiköiden välisiä hierarkisia suhteita voidaan määritellä tarkemmin, mikä parantaa hakumahdollisuuksia sekä ELANissa että verkkopohjaisella Trova-työkalulla.

Hakujen tekeminen ELANilla

ELANissa voi tehdä monipuolisia hakuja yhdestä tai useammasta ELANilla annotoidusta EAF-muotoisesta tiedostosta, jotka sijaitsevat omalla koneella. ELANilla annotoituja tiedostoja voidaan lisäksi jakaa LAT-järjestelmän kautta, jossa niistä voidaan tehdä hakuja selainpohjaisella Trova-työkalulla. Trova-haku toimii suunnilleen samoilla periaatteilla kuin ELAN-haku. Trovalla hakuja voi tehdä myös muiden tekemistä annotaatioista, jos niihin on käyttöoikeus.

ELANilla annotoidun aineiston julkaiseminen Kielipankin LAT-alustalla

Jos haluat saada aineistosi muidenkin haettavaksi verkon kautta (esim. omalle tutkimusryhmällesi Suomessa tai ulkomailla, tai tutkijoille laajemmin), toimi seuraavasti:

  1. Luo korpuksellesi LAT-alustaa varten ainakin suppeat IMDI-muotoiset kuvailutiedot eli metadata Arbil-ohjelmalla.
  2. Siirrä korpus verkkoon saataville Lamus-työkalun avulla. Tähän tarvitset LATia varten aktivoidun HAKA-käyttäjätunnuksen (ks. lisätietoja kirjautumisesta).
  3. Mikäli aineisto sen sallii, voit antaa muille tutkijoille henkilö- tai ryhmäkohtaisia käyttöoikeuksia korpuksesi lukemiseen, muokkaamiseen ja/tai hallinnointiin IMDI-selaimen kautta löytyvällä AMS-työkalulla.
  4. Kun korpus on valmis ja käyttökelpoinen ja haluat helposti viitata siihen julkaisuissa, sovi FIN-CLARINin kanssa aineistosi pysyvästä tallennuksesta ja julkaisusta Kielipankissa. Katso ohjeet.

LAT-ohjeet

Kuukauden tutkija: Krista Lagus

 

Yhteystiedot

Kielipankin tekninen ylläpito:
kielipankki (ät) csc.fi
p. 09 4572001

Aineistoihin ja muuhun sisältöön liittyvät asiat:
fin-clarin (ät) helsinki.fi
p. 029 4140599 / 029 4129317