FIN-CLARIN -johtoryhmän työpaja

Keskustelumuistio, LUONNOS 29.3.2018

Aika: ma 12.3.2018 klo 12:30-16:00
Paikka: Kabinetti 4, Sokos Hotel Vaakuna.

Osallistujat:
Nobufumi Inaba (Turun yliopisto)
Ari Huhta (Jyväskylän yliopisto)
Merja Koskela (Vaasan yliopisto)
Anna-Liisa Kristiansson (Kotus)
Mikko Kurimo (Aalto-yliopisto)
Martin Matthiesen (CSC)
Mikhail Mikhailov (Tampereen yliopisto)
Stefan Werner (Itä-Suomen yliopisto)
Krister Lindén, pj.
Hanna Westerlund, siht.

1. FIN-CLARIN esittely

Tutustuttiin Suomen Akatemian kautta saapuneeseen kansainväliseen arviointilausuntoon, jossa FIN-CLARIN on A-luokassa:

FIN-CLARIN – Common Language Resource and Technology Infrastructure in Finland

Hakemuksen kansainvälisen vertaisarvioinnin perusteella tutkimusinfrastruktuuri tukee korkeatasoista tiedettä. Tutkimusinfrastruktuurikomitea katsoo, että infrastruktuurin toiminta tukee kansallisen tutkimusinfrastruktuuripolitiikan tavoitteita ja että infrastruktuuri on toiminnaltaan hyvin edistynyt. Sijoittuminen Tiekartan ryhmään: A: HYVIN EDISTYNEET

2. Uusien hankkeiden lyhyt kertaus

  • Kotus: Nimiarkisto, 3 kokoelmaa, joista kaksi on tehty
  • Aalto: MeMaD, 3-vuotinen hanke, jonka aineistojen loppusijoituspaikka Kielipankki
  • CLARIN-työpajat ovat avoimia kaikille

3. FIN-CLARIN Upgrade (mitä tehty / mitä seuraavaksi edessä)

  • HY: Neuvotteluja keväällä YLE ja Kansalliskirjasto; sentimenttianalyysi (Emily Öhman) aineistojen annotointiin vaikuttaminen; Mylly roadshown aiheena
  • Aalto: Aalto-ASR puheentunnistus ja uuden version päivittäminen GitHubiin sekä ohjeistuksen parantaminen; suomen opettaminen pelin avulla Aallossa, äänidata, aineisto Kielipankkiin (Mikko tutkii lisenssointia); pois aineistojen versioinnista ja kohti karttuvia aineistoja
  • TaY: kaunokirjallisuuden rinnakkaistekstejä työn alla. Kehitystarve parantaa Korpin rinnakkaistekstien käsittelyä. Lakitekstien aineisto tekeillä. Myös verrannaiskorpus tulossa. Igor Kudashev ja mikroporjektit, voisi liittää Kielipankkiin. TextHammer Kielipankin työkaluksi.
  • JoY: käännössuomen korpus, kätytölupaehdot keskusteluun Joensuun yliopistossa. Mahdollisesti FIN-CLARIN-konsortiosopimus tässä apuun. Raja-Karjalan korpuksen laajennus.
  • Kotus: murre-arkiston synonyymiaineisto ja Rapola-aineisto sanat-alustalle. Houkuttelevampi käyttöliittymä sanat-alustalle.
  • VY: terminologiy forum päivittämistä vailla, rahoitusta on haettu. Ruotsin TNC siirtyy Språkrådetin hallintaan, ja mukana aineistoja Suomesta. Pelastusoperaatio näiden säilyttämiseksi. Aineiston digitointi tehty osittain. Käsialantunnistus/OCR kun pdf-muotoisena valmis. FIN-CLARIN-osaamista kaivataan teknisellä puolella.
  • TY: Agricola luovutettu.
  • JY: GDPR ja tietosuoja tapetilla.

4. Mahdolliset päätökset

  • ei päätöksiä

    5. Yhteenveto ja katsaus eteenpäin

    6. Muita asioita

    • Kotuksen varajäsen 12.3. alkaen on Anna-Liisa Kristiansson
    • Muita ajatuksia ja toiveita:
      • EmuR-paketti hyvä foneettisen analyysin tekemisessä, säästyy PRAAT-skriptauksella koska se sisältää PRAAT objektit. (Stefan)
      • KORP ja verrannaiskorpusten tulokset saisivat olla vierekkäin. (Mikhail)
      • K-Metrix
      • TextHammer Kielipankkiin (Mikhail)
      • Tietoturva-asiat (Ari)
      • RoadShow syksyllä 2018 loppusyksyllä
  • Hae Kielipankki-portaalista:
    Kuukauden tutkija: Emma Sepänaho

     

    Tulevat tapahtumat

    1. Course: Data Clinic 2019-20

      1.11.201917.4.2020
    2. Kielipankki kiertueella Vaasan yliopistossa

      12.2.2020 16.0018.00

    Yhteystiedot

    Kielipankin tekninen ylläpito:
    kielipankki (ät) csc.fi
    p. 09 4572001

    Aineistoihin ja muuhun sisältöön liittyvät asiat:
    fin-clarin (ät) helsinki.fi
    p. 029 4140599 / 029 4129317