Praatilla tehdyn TextGrid-tiedoston muuntaminen Elan-ohjelman EAF-muotoon

Esimerkkiaineisto: Kotuksen SKN-korpuksen tiedosto

  1. Tallenna annotaatiotiedosto Praat-ohjelmalla normaalina tekstitiedostona: valitse TextGrid-objekti objekti-ikkunassa ja valitse Save: Write TextGrid to text file… Tiedoston nimen päätteenä kannattaa käyttää merkkijonoa .TextGrid.
  2. Avaa koneellasi Elan-ohjelma.
  3. Valitse File:New.
  4. Klikkaa nyt avautuvasta ikkunasta Add Media File… ja etsi muunnettavaan TextGrid-tiedostoon liittyvä ääni- tai videotiedosto koneeltasi (esim. SKN03b.wav). Huom. mediatiedoston pitää olla Elan-ohjelman tukemassa formaatissa.
  5. Jos olet aikaisemmin tallentanut templaattitiedoston (.etf), jossa on sellaisia Elan-ohjelman käyttämien lingvististen tyyppien määrittelyjä, joita aiot käyttää annotaatiotiedostollesi, napsauta tässä ikkunassa vielä Add Template File ja etsi haluamasi templaattitiedosto (esim. SKN.etf).
  6. Paina OK. Äänisignaalin aaltomuodon pitäisi nyt tulla näkyviin mustana käyränä. Näytölle aukeaa lisäksi videoikkuna myös siinä tapauksessa, että mediatiedosto sisältää pelkän äänitteen. Tällöin videoikkunan voi piilottaa (sitä ei ainakaan testatussa Elan-versiossa pysty kokonaan sulkemaan).
  7. Tallenna näin luomasi annotaatiotiedosto heti mediatiedoston mukaisella nimellä, jotta muistat varmasti, mitä tiedostoa olet käsittelemässä! Valitse File: Save as…
  8. Nyt tuodaan Elaniin Praatin TextGrid-tiedostoon tallennetut annotaatiokerrokset.
    • Valitse File:Import…:Praat TextGrid file…
    • Klikkaa Browse ja etsi TextGrid-tiedosto, joka vastaa käsiteltävää äänitiedostoa (esim. TextGrid).
    • Rastita ikkunassa ruutu Skip empty intervals / annotations.
    • Elan-ohjelma ei tue Praatissa mahdollisia PointTier-tyyppisiä annotaatiokerroksia, joissa voidaan antaa nimikkeitä myös yksittäisille aikapisteille. Jos TextGrid-tiedosto sisältää PointTier-tyyppisiä annotaatiokerroksia ja nämä halutaan tuoda Elaniin, on pointit pakko muuntaa mielivaltaisen kestoisiksi annotaatioyksiköiksi. Rastita tässä tapauksessa Include Praat PointTiers ja valitse yksiköille mielestäsi järkevä kesto kohdassa Default PointTier annotation duration (ms).
    • Valitse annotaatioille jokin yleinen lingvistinen tyyppi, joka sopii oletusarvoksi (esim. SKN-korpuksen kohdalla tyyppi ”original sentence”).
    • Annotaatiokerrosten tuonti TextGridistä saattaa kestää tovin varsinkin siinä tapauksessa, että tiedosto on pitkä ja jotkin kerrokset sisältävät suuren määrän yksiköitä (esim. jos sanat, tavut ja/tai äänteet on annotoitu erikseen).
  9. Seuraavaksi on määritettävä jokaiselle Elan-dokumenttiin tuodulle annotaatiokerrokselle sopiva annotaatiotyyppi ja mahdollisesti myös kerrosten väliset ”sukulaisuussuhteet” eli kerrosten välinen käsitehierarkia.
    • Jos et vielä ole luonut valmiita annotaatiotyyppejä, luo nämä. [OHJE TULOSSA]
    • Valitse Tier: Change Parent of Tier…
      • Valitse listalta se annotaatiokerros, jolle pitää määrittää uusi vanhempi (esim. HL-sentence-norm). Klikkaa Next.
      • Valitse listalta se annotaatiokerros, josta tulee äskeisen tytärkerroksen vanhempi (esim. HL-original). Klikkaa Next.
      • Valitse linkitettävälle tytärkerrokselle sopiva lingvistinen tyyppi (esim. normalized sentence). Klikkaa Finish.
      • Kerrosten linkittäminen voi kestää hyvän tovin, jos annotaatioyksiköitä on paljon.
      • Tytärkerros muodostetaan kopioimalla alkuperäinen kerros uuteen kerrokseen, jonka nimen loppuosaksi lisätään -cp. Alkuperäisen kerroksen voi nyt poistaa: valitse kerroksen nimi kaksoisnäpäyttämällä sitä ikkunan vasemmassa laidassa, klikkaa sitten samaa kohtaa oikealla napilla ja valitse ponnahdusvalikosta Delete _kerroksen-nimi_, tai valitse Tier:Delete Tier… ja valitse kerroksen nimi ikkunan keskellä olevasta valikosta. Paina sitten ikkunan alareunasta Delete ja hyväksy klikkaamalla Yes.
    • Toista edellinen kohta kaikille sellaisille kerroksille, joista tulee jonkin toisen kerroksen ”lapsia”.
  10. Muuta jokaisen kerroksen muut tarvittavat ominaisuudet: Valitse Tier: Change Tier Attributes…
    • Valitse ikkunan keskellä olevasta valikosta vuorotellen kukin annotaatiokerros.
      • Poista tarvittaessa kerrosten nimistä loppuliite -cp, joka syntyi kun kerroksia linkitettiin toisten kerrosten ”jälkeläisiksi”. Klikkaa jokaisen muutoksen jälkeen ikkunan alareunasta Change, jotta muutos astuu voimaan.
      • Muuta niiden kerrosten lingvistinen tyyppi (Linguistic Type), joita ei ole linkitetty minkään toisen kerroksen ”lapsiksi” ja joiden tyyppi ei ole se, jonka valitsit oletustyypiksi, kun kerroksia tuotiin TextGrid-tiedostosta. Klikkaa jokaisen muutoksen jälkeen ikkunan alareunasta Change, jotta muutos astuu voimaan.
      • Lisää kunkin kerroksen Participant -kohtaan tarvittaessa puhujan tunnus (koodi, joka yksilöi puhujan tämän korpuksen sisällä, muttei sisällä henkilötietoja). Kun olet lisännyt tekstin kenttään, muista klikata ikkunan alareunasta Change, jotta muutos astuu voimaan ja tulee näkyviin ikkunan yläosassa ko. kerroksen kohdalla.
      • Tarvittaessa voit merkitä samalla tavalla eri kerrosten annotoijan/litteroijan (kohtaan Annotator). Tähän kannattaa merkata esim. jos kerroksen sisältämät tiedot on tuotettu jollakin automaattisella menetelmällä! Muista jälleen jokaisen muutoksen jälkeen klikata ikkunan alareunasta Change.
  11. Tallenna vielä EAF-tiedosto (File:Save).
Hae Kielipankki-portaalista:
Harri Uusitalo
Kuukauden tutkija: Harri Uusitalo

 

Tulevat tapahtumat


Yhteystiedot

Kielipankin tekninen ylläpito:
kielipankki (ät) csc.fi
p. 09 4572001

Aineistoihin ja muuhun sisältöön liittyvät asiat:
fin-clarin (ät) helsinki.fi
p. 029 4129317

Tarkemmat yhteystiedot