Aineiston tekninen muoto: Äänitiedostojen näytteistäminen

Tutkimusta varten arkistoitavien äänitiedostojen tulee olla laadultaan ja tarkkuudeltaan tarkoituksenmukaisia.

Mitä suuremmalla tarkkuudella äänitiedosto tallennetaan, sitä enemmän levytilaa tiedosto vie. Suurikokoisten tiedostojen käsittely ja analyysi voi myös vaatia enemmän laskentatehoa. Aineistoa arkistoidessa täytyy ennakoida erilaisia tulevia tutkimustarpeita ja pyrkiä säilyttämään mahdollisesti hyödyllinen informaatio. Hyvissä olosuhteissa ja korkealaatuisilla laitteilla äänitettyä sekä korkealla resoluutiolla digitoitua äänisignaalia voidaan tutkia monipuolisesti sekä kuulonvaraisin että erilaisin teknisin menetelmin. Jos taas äänitteestä on olemassa vain heikolla resoluutiolla tallennettu tai häviöllisesti pakattu (esim. MP3-muotoinen) tiedosto, äänisignaalia ei voida enää jälkikäteen palauttaa parempaan tarkkuuteen.

Käytännön syistä on järkevää säilyttää aineistosta arkistokopiot riittävän suurella tarkkuudella ja tallentaa tiedostoista tarvittaessa matalammalla tarkkuudella ns. käyttökopioita, joiden käsitteleminen on teknisesti nopeampaa.

On hyvä huomata, ettei hienolla nauhurilla ja suurella digitointitarkkuudella ole mahdollista pelastaa tilannetta, jos mikrofonit on suunnattu väärin tai sijoitettu liian kauas halutuista äänilähteistä tai jos äänitystapahtuma on ollut muilta osin huonosti suunniteltu. Äänitiedoston näytetaajuuden nostaminen jälkikäteen ei myöskään ole sisällön kannalta hyödyllistä.

Äänitiedostojen suositeltava tarkkuus

Suosittelemme äänitiedostojen näytekooksi eli näytesyvyydeksi (engl. bit depth) vähintään 16 bittiä, joka myös yleensä riittää tavanomaiseen äänitteiden analyysiin.

Näytetaajuudeksi (sample rate, sample frequency) suositellaan esimerkiksi puheen akustis-foneettista tutkimusta silmällä pitäen vähintään 22050 Hz (= 22,05 kHz). Puheteknologisissa sovelluksissa käytetään usein alempaa 16 kHz:n näytetaajuutta, jonka katsotaan riittävän kyseisiin tarkoituksiin.

Esimerkiksi CD-äänilevyissä käytetty näytetaajuus on 44100 Hz (44,1 kHz) ja näytesyvyys 16 bittiä. Digitaaliset CD:t on alun perin tarkoitettu musiikin vivahteista kiinnostuneen ihmisen kuunneltaviksi, ja 44100 Hz:n näytetaajuuden avulla voidaankin tallentaa enintään 22050 Hz:n taajuisia ääniä. Hyvillä laitteilla ihmisen kuuloalueen ylärajaa hipovia ääniä voidaan ainakin periaatteessa myös toistaa. CD-levyt ovat myös kaksikanavaisia stereoäänitteitä. Stereoäänitiedoston koko on kaksinkertainen yksikanavaiseen ts. monoäänitiedostoon verrattuna.

Äänitiedostojen näytetaajuuden muuntaminen ja yhtenäistäminen

Jos sinulla on omalla koneellasi yhdessä kansiossa vaikkapa wav-päätteisiä äänitiedostoja ja haluaisit saada niistä kopiot tietyllä taajuudella näytteistettyinä, kokeile SpeCT-kokoelmaan kuuluvaa Praat-skriptiä change_sample_rate_in_folder.praat.

  1. Koneellasi pitää olla asennettuna Praat-ohjelma, jolla Praat-skriptejä voi käyttää. Praat on saatavilla ilmaiseksi ja melkein kaikille käyttöjärjestelmille.
  2. Lataa yllä mainittu skripti ensin täältä ja tallenna skriptitiedosto omalle koneellesi sopivaan paikkaan, josta löydät sen myöhemmin helposti.
  3. Avaa Praat.
  4. Avaa koneelle tallentamasi skriptitiedosto change_sample_rate_in_folder.praat Praat-ohjelmaan valitsemalla Open: Read from file…
  5. Käynnistä skripti valitsemalla editori-ikkunassa Run: Run. Skriptin alussa ilmestyvään lomakkeeseen annetaan hakemistopolku siihen paikkaan, jossa muunnettavat äänitiedostot ovat, sekä haluttu näytetaajuus (esimerkiksi 22050 tai 44100, vrt. yllä). Tiedostojen koosta ja muuntamistarpeista riippuen uudelleen näytteistäminen kestää jonkin aikaa – odota rauhassa.
  6. Muunnetut äänitiedostot ilmestyvät uuteen alihakemistoon entisen hakemiston sisälle.

Komentoriviin tottuneet käyttäjät voivat näytteistää äänitiedostoja nopeasti esimerkiksi unix-pohjaisista järjestelmistä löytyvällä sox-työkalulla. Pienillä muutoksilla myös edellä mainittua Praat-skriptiä on mahdollista käyttää komentoriviltä. Ilman graafista käyttöliittymää se toimii huomattavasti nopeammin.

Hae Kielipankki-portaalista:
Juraj Šimko
Kuukauden tutkija: Juraj Šimko

 

Tulevat tapahtumat


Yhteystiedot

Kielipankin tekninen ylläpito:
kielipankki (ät) csc.fi
p. 09 4572001

Aineistoihin ja muuhun sisältöön liittyvät asiat:
fin-clarin (ät) helsinki.fi
p. 029 4129317

Tarkemmat yhteystiedot