Suomen ELRC-työpaja 19.2.2016

EU:ssa on 24 virallista kieltä, joilla kansalaisia on voitava tasavertaisesti palvella. Käännettävien tekstien määrä kasvaa jatkuvasti niin julkishallinnossa, liike-elämässä kuin muuallakin yhteiskunnassa. Tämä lisää paineita monikielisen käännösteknologian kehittämiseen, etenkin kun Euroopan komission vuoden 2016 tavoitteena on rakentaa Eurooppaan yhtenäinen digitaalinen markkina-alue (YDM). Monien kielten kohdalla riittämätön kieliteknologinen tuki haittaa julkisten palveluiden käyttöä ja liiketoimintaa.

Helsingissä järjestettiin 19.2.2016 Eurooppalaisten kielivarojen koordinaation (The European Language Resource Coordination, ELRC) työpaja. Tilaisuuden tavoitteena oli saada suomalaiset julkishallintoelimet huomaamaan, että niiden hallussa on runsaasti kieliaineistoja, joiden avulla monikielisen konekäännösjärjestelmän toimivuutta voitaisiin merkittävästi parantaa. Samalla käännösalustaa voitaisiin räätälöidä hallinnon omiin käännöstarpeisiin sopivaksi.

Työpajassa esiteltiin Euroopan komission tulevaa CEF.AT-konekäännösalustaa, joka helpottaa mm. asiakirjojen ja muun kielellisen sisällön vaihtoa Euroopan kansallisten julkishallintojen sekä EU:n hallintoelinten, kansalaisten ja yritysten välillä. Työpajaan osallistui kutsuttuja puhujia Euroopan komissiosta, kansallisesta julkishallinnosta ja hallintoelimistä, kielipalveluja tarjoavista yrityksistä sekä kieliteknologian alalta.

CEF.AT-käännösalusta perustuu ns. tilastolliseen konekääntämiseen, jossa järjestelmä oppii kääntämistä esimerkkien perusteella. Käännösalustan kehittämisen kannalta hyödyllinen aineisto voi sisältää esimerkiksi yksikielisiä tekstejä, tekstien käännöksiä eri kielille, käännösmuisteja, sanastoja tai terminologioita, kunhan nämä ovat digitaalisessa muodossa. Aineistojen käytöstä pitää vain sopia.

Työpajassa sanottua

Työpajan yhteenveto-osuudessa puhujilta kysyttiin, millaisia tuloksia he työpajalta odottavat. He vastasivat näin:

Toivon, että avoin data lisääntyy myös julkishallinnon puolella. Tästä seuraisi mm. konekäännöstulosten paraneminen ja siitä olisi hyötyä kansalaisille ja yrityksille, sillä avoimen datan avulla on mahdollista rakentaa monenlaista liiketoimintaa. – Kimmo Rossi, Euroopan komissio

Toivon, että suomalaisten julkishallinnon organisaatioiden verkkosivujen alanurkkaan ilmestyisi CC BY -merkki. Vain tällä ehdolla verkkosivujen sisältöä saa käsitellä avoimena datana. – Krister Lindén, FIN-CLARIN

Toivon, että Suomessa olisi ryhmä julkishallinnon ihmisiä, joille on tärkeää, että suomen kieli saa riittävästi kieliteknologista tukea ja voi näin suoriutua digitaalisen ajan haasteista. – Andrejs Vaslijevs, ELRC

Katso työpajan videot ja esitykset osoitteessa http://www.lr-coordination.eu/l2finland


Hae Kielipankki-portaalista:
Tommi Kurki
Kuukauden tutkija: Tommi Kurki

 

Yhteystiedot

Kielipankin tekninen ylläpito:
kielipankki (ät) csc.fi
p. 09 4572001

Aineistoihin ja muuhun sisältöön liittyvät asiat:
fin-clarin (ät) helsinki.fi
p. 029 4144036 / 029 4129317