Kielipankki Live 24.8.2020

In English

<< Kielipankki Live -tapahtumien pääsivu

Ensimmäinen Kielipankki Live järjestettiin 24.8.2020 klo 13-15. Tilaisuus pidettiin suomeksi ja juontajana toimi projektisuunnittelija Mietta Lennes. Tapahtuman keskeiset osat ovat katsottavissa YouTubessa (videoiden tekstitykset tulossa myöhemmin). Esitysten materiaalit ovat saatavilla ohjelman kohdalta.

Kun haluat pysyä ajan tasalla Kielipankki Live -tilaisuuksista ja muista Kielipankin uutisista, tilaa uutiskirje. Katso myös Kielipankin esittely!

Kielipankki Live 24.8. klo 13-15

Tapahtuman keskeiset osat ovat katsottavissa YouTubessa. Lisäksi esitysten materiaalit ovat saatavilla ohjelman kohdalta.


Jani Marjanen

Kaikkien aikojen ensimmäisen Kielipankki Live -tapahtuman vieraana on Pohjoismaiden historian tutkija Jani Marjanen.
Lahjoita puhetta

Lahjoita puhetta
-kampanjassa kerätään monipuolista puheaineistoa sekä tutkijoiden että yritysten käyttöön.
Korp-palvelu

Kielipankin Korp-hakupalvelu
päivittyy – kysymme Jyrki Niemeltä, mitä uutta on luvassa.

Ohjelma

<< Kielipankki Live -tapahtumien pääsivu

In English

European Language Grid (ELG): esittely ja yleiskatsaus

ELG:n neljäs alueellinen työpaja: Suomi

15.12.2020 klo 14.00-16.30
Verkkotapahtuma

 

European Language Grid (ELG) kehittää digitaalista markkinapaikkaa, jonka kautta eurooppalaiset yritykset, organisaatiot ja kansalaiset voivat sekä tarjota että tehokkaasti käyttää kieliteknologisia työkaluja, datasettejä ja palveluita. Joulukuussa järjestettävän työpajan tavoitteena on esitellä ELG:n toimintaperiaatetta ja kertoa pilottihankkeiden etenemisestä. Tervetuloa keskustelemaan siitä, mitä ELG tarjoaa sinulle!

Ilmoittautuminen

ELG-työpaja on ilmainen tapahtuma, mutta siihen on ilmoittauduttava ennakkoon. Ilmoittaudu ELRC:n verkkosivujen kautta 10.12.2020 mennessä.

Huomaa, että aiemmin samana päivänä klo 9.30-12.30 järjestetään myös Suomen kolmas ELRC-työpaja. Samalla lomakkeella voit ilmoittautua mukaan molempiin verkkotapahtumiin.

Ohjelma (muutokset mahdollisia)

ELG-työpaja järjestetään englanninkielisenä.

14:00Welcome and introduction
14:05ELG Overview
14:30ELG online demo
14:50Finnish Pilot Projects funded in ELG
15:20Expectations/requirements of Finnish Language Technology providers
  • Marko Turpeinen, 1001Lakes: Kielialusta
  • t.b.a.
15:40Summary and discussion
16:00End of workshop
16:15Tutorial: How to integrate a service into ELG
This tutorial may be organized according to requests from the participants. Please indicate your interest in the registration form.

Viimeksi päivitetty: 26.11.2020

Verkkokurssi Data Clinic 2020-21 alkaa pian

Data Clinic -verkkokurssi tukee sinua käytännön ongelmissa, jotka liittyvät gradusi tai väitöskirjasi tutkimusaineiston hallintaan. Jos täytät kurssin vaatimukset, voit osallistua mistä tahansa yliopistosta käsin. Kurssilla on vielä tällä hetkellä reilusti tilaa. Huomaa kuitenkin, että osallistujien määrä on rajoitettu ja Helsingin yliopiston LingDig-maisteriohjelman opiskelijat ovat etusijalla, jos tungosta tulee. Kurssilla on pääosin englanninkieliset materiaalit.

Lue lisää ja ilmoittaudu mukaan…

 

Katso kaikki kurssit ja koulutukset

In English

Suomen kolmas European Language Resource Coordination (ELRC) -työpaja

Verkkotapahtuma
15.12.2020 9.30-12.40

Järjestäjät:
The European Language Resource Coordination (ELRC) -konsortio
Digitaalisten ihmistieteiden osasto, Helsingin yliopisto

Tervetuloa Suomen kolmanteen ELRC-työpajaan!

Kieliteknologia muovaa monikielistä tulevaisuuttamme. Se on jo muuttanut tapoja, joilla olemme vuorovaikutuksessa keskenämme ja joilla ostamme, työskentelemme ja matkustamme. Kieliteknologiaa tarvitaan ja käytetään monissa arjen palveluissa niin julkisella kuin yksityiselläkin sektorilla. Tukenamme on ohjelmia, jotka korjaavat oikeinkirjoitusvirheet automaattisesti ja auttavat vaativassakin kirjoitustyössä; digitaalisia avustajia, jotka muuttavat puheen matkapuhelimissa oleviksi tekstiviesteiksi; botteja, jotka vastaavat puheluun, kun soitamme pankille tai sosiaali- ja terveyspalveluihin; järjestelmiä, jotka kääntävät kielestä toiseen automaattisesti, ja monia muita palveluita. Mutta voimmeko käyttää omaa kieltämme kaikenlaisessa digitaalisessa vuorovaikutuksessa? Ovatko palvelut oikeasti käyttövalmiita? Onko suomen kieli tarpeeksi hyvin tuettu pysyäkseen mukana tekoälyn kehityksessä?

Suomen kolmas European Language Resource Coordination (ELRC) -työpaja käsittelee näitä kysymyksiä ja edistää keskustelua suomenkielisen kieliteknologian asemasta ja tulevaisuudennäkymistä. Työpajassa kieliteknologian kehittäjät, soveltajat ja käyttäjät sekä yksityiseltä että julkiselta sektorilta jakavat kokemuksia, vaatimuksia ja tapoja, joilla kieliteknologian avulla voidaan tukea ja parantaa digitaalista vuorovaikutusta monikielisessä Euroopassa. Lopuksi keskustelemme siitä, kuinka kielidata eli teksti- ja puheaineistot voivat edistää tekoälyn kehitystä.

Työpaja on jatkoa Suomen edellisille ELRC-työpajoille, jotka järjestettiin 19.2.2016 ja 24.10.2018.

Nyt yhteistyössä European Language Gridin kanssa

Tämänkertainen ELRC-työpaja järjestetään yhteistyössä European Language Gridin (ELG) kanssa. ELG:n työpaja järjestetään iltapäivällä klo 14 alkaen, ks. ELG-työpajan verkkosivu. Tervetuloa mukaan molempiin tapahtumiin!

Ilmoittautuminen

ELRC-työpaja on ilmainen tapahtuma, mutta siihen on ilmoittauduttava ennakkoon. Voit ilmoittautua samalla lomakkeella sekä aamupäivän ELRC-työpajaan että iltapäivän ELG-työpajaan.

Ilmoittaudu ELRC:n sivujen kautta 10.12.2020 mennessä. Tervetuloa!

Ohjelma (muutokset mahdollisia)

Aamupäivän ELRC-työpaja on suomenkielinen ja englanninkieliset puheenvuorot tulkataan. Iltapäivän ELG-työpaja on englanninkielinen.

09:30 – 09:40

Tervetuloa
Krister Lindén, Helsingin yliopisto / FIN-CLARIN

09:40 – 10:00

Kieliteknologian ja tekoälyn mahdollisuudet – nykytila ja tulevaisuus
Jörg Tiedemann, Helsingin yliopisto

10:00 – 10:30

Suomalaiset ja suomenkieliset kieliteknologiat – paneelikeskustelu
Filip Ginter, Turun yliopisto (Moderator)
Sebastian Andersson, Lingsoft
Jörg Tiedemann, Helsingin yliopisto
Sampo Pyysalo, Turun yliopisto
Pasi Tapanainen, Etuma
Kaarina Hyvönen, Kielikone

10:30 – 10:45

Kahvitauko

10:45 – 11:15 

CEF AT -palvelun esittely ja demo
Vilmantas Liubinas, 
Euroopan komissio

11:15 – 11:45

Kieliteknologiat julkisella sektorilla – paneelikeskustelu
Jouko Salonen, Maahanmuuttovirasto (vetäjä)
Osma Suominen, Kansalliskirjasto
Ville Viitasaari, Kela
Kaisamari Kuhmonen, Valtioneuvoston kanslia

11:45 – 12:15

Kielidatan luominen, hallinta ja jakaminen: olemassa olevia käytänteitä ja haasteita – paneelikeskustelu
Aleksi Rossi, YLE (vetäjä)
Krister Lindén, Helsingin yliopisto / FIN-CLARIN
Mikko Kurimo, Aalto-yliopisto
Tommi Kurki, Turun yliopisto

12:15 – 12:30

Kieliteknologian menestystarinoita
(esiintyjä ilmoitetaan myöhemmin)

12:30 – 12:40

Yhteenveto
Krister Lindén, Helsingin yliopisto / FIN-CLARIN

12:30 – 14:00

Tauko

14:00 – 16:30

European Language Grid (ELG): Esittely ja yleiskatsaus.
Neljäs alueellinen European Language Grid (ELG) -työpaja Suomessa

ELG-työpaja järjestetään yhdessä European Language Gridin (ELG) kanssa. Huomaa, että ELG-työpaja pidetään vain englanniksi. Tervetuloa päivän molempiin tapahtumiin!
Katso ELG-työpajan lisätiedot ja tarkka ohjelma

Ilmoittaudu ELRC:n sivujen kautta 10.12.2020 mennessä. Tervetuloa!

Lisätietoja järjestäjiltä:

Mietta Lennes ja Tommi Jauhiainen
Helsingin yliopisto / FIN-CLARIN
fin-clarin [ATT] helsinki.fi

Viimeksi päivitetty: 26.11.2020

ELRC:n ja ELG:n kanssa on suunnitteilla yhteistapahtuma 15.12.2020

FIN-CLARIN aikoo järjestää ELRC:n (European Language Resource Coordination) ja ELG:n (European Language Grid) kanssa yhteisen työpajapäivän 15.12.2020. Tapahtumissa kohtaavat suomalaiset yritykset, organisaatiot ja tutkijat, jotka kehittävät, tarjoavat tai hyödyntävät kieliteknologiaa ja haluavat tarjota tai käyttää monikielisiä palveluita. Työpajat toteutetaan etäyhteydellä.

Merkitse kalenteriin! Työpajojen ohjelma ja tarkemmat tiedot ilmoitetaan myöhemmin verkkosivulla.

Osallistu verkkokurssille Puheen analyysin perusteet!

Kaikille yliopistoille avoin verkkokurssi Puheen analyysin perusteet (5 op) on jälleen alkanut. Kurssi tarjotaan nyt ensimmäistä kertaa sekä suomen- että englanninkielisenä. Ryhmäkoon salliessa voit liittyä mukaan mistä tahansa yliopistosta vielä 6.11.2020 saakka. Kurssin kotisivulla on ohjeet Moodle-alueelle liittymiseen.

Puheen analyysin kurssilla opitaan litteroimaan ja annotoimaan puhetta ja ymmärtämään keskeisimpiä akustisia kuvaajia ja mittausmenetelmiä, joita puheen tutkimisessa voidaan hyödyntää. Työkaluna käytetään lähinnä Praat-puheanalyysiohjelmaa, mutta myös ELANiin tutustutaan. Kurssi soveltuu fonetiikan ja kieliaineiden opiskelijoiden lisäksi muillekin aloille, joilla halutaan tutkia puheäänitteitä.

FIN-CLARINin koko kurssitarjonta löytyy kootusti Koulutus-sivulta.

Kielipankki Live 24.8.2020 – Lahjoita puhetta: haastattelussa Krister Lindén

Tutkimusjohtaja Krister Lindén

Elokuussa 2020 järjestetyssä Kielipankki Live -verkkotapahtumassa Mietta Lennes haastatteli FIN-CLARINin tutkimusjohtaja Krister Lindéniä, joka kertoi Kielipankin roolista Lahjoita puhetta -kampanjassa.

Miten Lahjoita puhetta -kampanja sai alkunsa ja miten Kielipankki liittyy siihen?

– Vuosi sitten VAKE pyysi Helsingin yliopiston Kielipankilta selvityksen siitä, mitä tarvitaan sellaisen kielikeskeisen tekoälyn toteuttamiseksi, jolla voidaan edistää suomalaista yhteiskuntaa. Selvityksessä kävi ilmi, että monenlaisia tekoälyyn soveltuvia yleisaineistoja on, mutta teollisuudelle soveltuvia isoja arkikielen puheaineistoja vielä puuttui.

– Esim. YLEllä on paljonkin puheaineistoja, mutta niihin liittyy monella tavalla tekijänoikeuksia. Myös Kotuksella on isoja murreaineistoja, mutta niitä voi kiistattomasti käyttää vain tutkimustarkoituksiin, koska ne on kerätty ennen uutta GDPR:ää.

Kuka voi saada aineistoa ja mitä sillä voi tehdä?

– Puhelahjoitukset on nyt kerätty sellaisilla sopimuksilla, että niitä voi käyttää sekä tutkimus- että tuotekehitystarkoituksiin, mutta niitä ei voi toistaa suurelle yleisölle sellaisinaan.

Yleisöltä on jo tullut etukäteen tiedusteluja siitä, milloin Lahjoita puhetta -aineistoa voisi saada tutkittavaksi. Milloin se tapahtuu?

– Tällä hetkellä aineisto kertyy tietokantaan, jonka kustannusrakenne sattuu olemaan sellainen, että aineiston kertyminen ja tallennus ei maksa kovin paljon, mutta sen kopiointi omaan käyttöön maksaa jonkin verran. 

– Lisäksi mahdolliset poistopyynnöt on helpompi hallinnoida, jos aineisto on vain yhdessä paikassa. Kokemuksen perusteella ihmiset saattavat tulla katumapäälle muutaman päivän tai viikon sisällä siitä, kun lahjoitus on tehty, mutta harvoin sen jälkeen.

– Nämä yhdessä tekevät sen, että järkevin ajankohta, milloin aineisto kannattaa tarjota muiden käyttöön on vähän sen jälkeen, kun keräyskampanja on päättynyt ja aineisto on siirretty pysyvästi Kielipankkiin.

Kuinka kauan Lahjoita puhetta -kampanja jatkuu?

– YLEn kampanja on suunniteltu tämän vuoden loppuun suomen kielen osalta. Tavoite on 10 000 tuntia ja tarkoitus on kerätä aineisto, missä sukupuoli-, ikäryhmä- ja murrejakauma on riittävän tasapainoinen. Tämä otetaan huomioon, kun päätetään voidaanko kampanja lopettaa vuodenvaihteessa.

– Näköpiirissä on, että suomenruotsin keräyskampanja alkaisi vasta syksyllä ja jatkuu sen takia vielä ensi vuoden puolella.

Milloin yritykset voivat saada aineiston?

– Tarvitaan vähän aikaa aineiston jakelun valmisteluun, joten näillä näkymin yritykset voisivat saada suomen aineiston ensi vuoden toisella vuosineljänneksellä.

Voisiko myös sitä hauskaa puheenkeruusovellusta käyttää aineiston keräämiseen omissa tutkimusprojekteissa?

– VAKE, joka on rahoittanut sovelluksen, on ainakin aikaisemmin ilmoittanut että sovellus julkaistaan avoimena lähdekoodina, jota voi hyödyntää ja kehittää eteenpäin.


Kielipankki Live -tapahtumien verkkosivu

Linkkejä

Ilmoittaudu nyt uuteen Kielipankki Live -verkkotapahtumaan!

Kielipankki Live on uusi verkkotapahtumien sarja, jossa haastatellaan tutkijoita ja keskustellaan ajankohtaisista Kielipankkiin liittyvistä aiheista. Tapahtumat videoidaan ja tallenteet ovat katsottavissa jälkikäteen tällä sivulla, myöhemmin myös tekstitettyinä.

Ensimmäinen Kielipankki Live -tilaisuus järjestetään maanantaina 24.8. klo 13.00 alkaen. Ilmoittautumalla jo ennakkoon varmistat itsellesi Zoom-kutsulinkin ja saat myös tilaisuuden jälkeen tiedon, kun videotallenne on katsottavissa.

Ilmoittautuminen ja lisätiedot: https://www.kielipankki.fi/kielipankki-live/

The Donate Speech (Lahjoita puhetta) campaign kicks off 16.6.2020

The Language Bank of Finland is working together with the Finnish Broadcasting Company (Yle) and the Finnish State Development Company (Vake Oy) in the Donate Speech campaign (Lahjoita puhetta) launching on 16th June 2020. The aim of this project is to collect all kinds of Finnish speech from all kinds of people, from all over Finland and abroad.

By donating your speech, you can help researchers and companies to study language and to develop technology and services that can be used in Finnish more fluently in the future. All variants of spoken Finnish are welcome – including the speech of second-language Finnish learners. As long as you speak some Finnish and can understand the Finnish instructions in the app, you can donate!

Read more about the contribution of the Language Bank of Finland (in Finnish)

Go and donate your speech!

See also:

Interview of Mietta Lennes in the morning radio program Puheen Aamu on Yle Puhe 16.6.2020 (the program is available in Finnish for one week after time of broadcast)

Lahjoita puhetta -kampanja käynnistyy 16.6.2020

Kielipankki on mukana 16.6.2020 käynnistyvässä Ylen, Helsingin yliopiston ja Valtion kehitysyhtiö Vake Oy:n toteuttamassa Lahjoita puhetta -kampanjassa, jossa kerätään puhetta kaikkialta Suomesta, erilaisilta ihmisiltä. Lahjoittamalla puhettasi voit auttaa tutkijoita ja tekoälyä kehittäviä yrityksiä luomaan palveluita, jotka toimivat sujuvammin myös suomeksi.

Lue lisää…

Katso myös:

Mietta Lennes haastateltavana Yle Puheen Aamussa 16.6.2020 klo 9

Kielipankki esillä NexusLinguarum-hankkeen (COST Action 18209) ensimmäisessä yleiskokouksessa Prahassa

Suomi on mukana NexusLinguarum-nimellä kulkevassa COST-hankkeessa (COST Action 18209), jonka tavoitteena on rakentaa eurooppalaista verkkopohjaisen kielitieteellisen datatieteen verkostoa. Kyseisen COST-hankkeen ensimmäinen yleiskokous pidettiin Prahassa 27.-28.1.2020. Mietta Lennes osallistui kokoukseen FIN-CLARINin edustajana ja esitteli Kielipankkia oheisella posterilla.

 

Poster of the Language Bank of Finland (Kielipankki)

ParlaCLARIN II -työpaja: Eduskuntatyöskentelyyn ja muuhun poliittiseen keskusteluun liittyvät aineistot (LREC2020)

Vuoden 2020 ParlaCLARIN-työpaja pidetään Marseillessa osana LREC2020-konferenssia (Language Resources and Evaluation Conference). Julkaisukutsu on avoinna 14.2.2020 saakka. Lue lisää:

https://www.clarin.eu/ParlaCLARIN-II

ParlaCLARIN II Call for Papers: LREC2020 workshop on creating, using and linking parliamentary corpora with other types of political discourse

The 2020 ParlaCLARIN workshop will be held in Marseille (France), as part of the 12th edition of the Language Resources and Evaluation Conference (LREC2020). The Call for Papers is now open and the paper submission deadline is 14 February 2020. Read more:

https://www.clarin.eu/ParlaCLARIN-II

Ilmoittaudu verkkokursseille

FIN-CLARIN järjestää jälleen verkkokurssin Puheen analyysin perusteet (ajalla 28.10.–13.12.2019) sekä erityisesti opinnäytteiden tekijöille suunnatun kurssin Data Clinic (1.11.2019–17.4.2020, huom. englanninkieliset materiaalit). Tammikuussa alkaa jälleen myös Korpuslingvistiikka ja tilastolliset menetelmät -verkkokurssi, jonka voi suorittaa kevään kolmannella periodilla joko suomeksi tai englanniksi.

Puheen analyysin kurssille voit ilmoittautua vaikka heti, ja Data Clinic -kurssin Moodle-alue avautuu lähipäivinä. Kursseille on mahdollista osallistua myös muista kuin Helsingin yliopistosta käsin.

Koko kurssitarjotin löytyy kootusti Koulutus-sivulta.

Tervetuloa mukaan!

Research Data and Humanities (RDHum2019), August 14-16, 2019 in Oulu, Finland

The preliminary program and the book of abstracts have been published on the conference website
https://www.oulu.fi/suomenkieli/node/55261

 

Registration: by July 31, 2019, see the instructions on the website.
Further information: RDHum2019 [AT] oulu.fi
Welcome to Oulu!

In English

XLVI Kielitieteen päivät 16.–18. toukokuuta 2019

järjestetään Joensuussa Itä-Suomen yliopistossa. Tapahtuman teemana on kieli, elämä ja yhteiskunta. Myös Kielipankki näkyy paikan päällä ja etenkin perjantaiaamupäivällä 17.5. saatat bongata yliopistolla ihmisiä, joilla on yllään vaaleansininen possupaita… Vedä meitä hihasta, poikkea esittelypisteellä tai tule kuuntelemaan esitelmiä!

Kielipankki-aiheisten esitysten alustava aikataulu

Kielitieteen päivien päivitetty ohjelma ja lisätiedot

Tervetuloa tutustumaan Kielipankkiin esittelypisteellä konferenssin aikana!

Suomeksi

The XLVI Annual Conference of Linguistics

will be organized in Joensuu by the University of Eastern Finland. The theme of the conference is language, life, and the society. The Language Bank of Finland will be present during the conference and especially on Friday morning, you might notice some people wearing a pale blue t-shirt with a happy piglet… Come and talk to us, visit our stand or see our presentations!

Pre-final schedule of the presentations related to the Language Bank of Finland:

  • Thursday 16.5. 16:30 room AG106 / Selkokielen työpaja (Klaara-verkosto):
    Kielipankin selkosuomen aineistot (The Easy-to-read Finnish corpora in the Language Bank of Finland; Hanna Westerlund)
  • Friday 17.5.  10:00-10:30 room AG101:
    Kielipankin kiertue 2019: Työkalut, aineistot ja muut palvelut (Kielipankki Roadshow 2019: Tools, corpora and other services; Mietta Lennes)

Updated programme and further information about the Annual Conference of Linguistics

Welcome to meet Kielipankki, The Language Bank of Finland at its stand during the conference!

Introduction to the Language Bank of Finland at the workshop “Digital Parliamentary data and research”

Friday 3 May at 12.00
Aalto University (Otaniemi), CS-Building, Room T4 / A238 (Konemiehentie 2)

The aim of the workshop was to discuss the novel digital parliamentary datasets—in particular those of Parliament of Finland—their use in research, the related research resources and tools, and their future development for researchers, but also for citizens and the media. FIN-CLARIN and the Korp version 1.1 of the Plenary Sessions of the Parliament of Finland, available in the Language Bank of Finland, was also presented during the afternoon.

Mietta Lennes: FIN-CLARIN and Parliamentary Data in Kielipankki – the Language Bank of Finland (PowerPoint / PDF slides)

Further information including the programme of the workshop can be found at https://www.helsinki.fi/en/helsinki-centre-for-digital-humanities/workshop-digital-parliamentary-data-and-research.

Learn to process your own data in the Corpus Clinic

The registration deadline of the online course Corpus Clinic has been extended to 23rd November, until when it is possible to join the course area on Moodle. Students from the University of Helsinki as well as from other universities can enrol.  Please note, however, that a limited number of participants can be accepted. See further instructions on the course page.

In the Corpus Clinic, you will learn about the various methods and tools that are available for managing, processing and analyzing your data. You will also learn to write a data management plan. If required, it is possible to complete the course fully online.

This year, the course is jointly organized by FIN-CLARIN and HELDIG. During the spring term – after passing the initial stage of the course – each participant will have the opportunity to meet with a member of the supporting group of digital humanities experts who can help you with more specific questions about your data analysis. More information about this will be provided during the course.

 

Verkkokurssi Puheen analyysin perusteet on alkanut

Kurssille on avoin kaikkien suomalaisten yliopistojen opiskelijoille. Kurssille voi liittyä vielä 7.11.2018 asti.

Katso lisätiedot kurssisivulta!

Hae Kielipankki-portaalista:
Tommi Kurki
Kuukauden tutkija: Tommi Kurki

 

Yhteystiedot

Kielipankin tekninen ylläpito:
kielipankki (ät) csc.fi
p. 09 4572001

Aineistoihin ja muuhun sisältöön liittyvät asiat:
fin-clarin (ät) helsinki.fi
p. 029 4144036 / 029 4129317