ParlaCLARIN IV -työpaja: Eduskuntatyöskentelyyn ja muuhun poliittiseen keskusteluun liittyvät aineistot (LREC-COLING 2024)

Vuoden 2024 ParlaCLARIN-työpaja järjestetään toukokuussa Torinossa, Italiassa osana LREC-COLING 2024 -konferenssia (Joint International Conference on Computational Linguistics, Language Resources and Evaluation).

Esitelmäkutsu on avoinna 19.2.2024 saakka. Lue lisää: https://www.clarin.eu/ParlaCLARIN-IV

<< FIN-CLARIAH Overview

FIN-CLARIAH Meeting 1.12.2023 11-17

Place: Väinö Linna -sali, Linna Building, Kalevantie 5, Tampere

 

Preliminary Program

11.00-11.10 Welcoming Words by Sanna Kumpulainen, Associate Professor in Information Studies, Tampere University

11.10-12.00 Keynote I on Studying SSH Research Needs: Elina Late, Senior Research Fellow in Information Studies, Tampere University

12.00-13.00 Lunch

13.00-13.45 Keynote II on Language Models: Sampo Pyysalo, Associate Professor at the Department of Computing, University of Turku

>>Download the slides of the work package presentations<< (pdf)

13.45-14.30 Work Package Presentations I

13.45-14.00 WP1.3 Veronika Laippala: Noise-Tolerant NLP

14.00-14.20 WP1.1, 1.2, 2.1, 2.2. & 2.3 Mietta Lennes: Kielipankki – The Language Bank of Finland

14.20-14.25 WP2.4 Harri Kettunen: Helsinki Term Bank for the Arts and Sciences

14.25-14.30 WP2.5 Jenny Tarvainen: Automated Text Tools for Learner Language

14.30-15.00 Coffee

15.00-16.00 Work Package Presentations II

15.00-15.05 WP3.1 Martin Matthiesen: Pipeline from the National Library to CSC

15.05-15.10 WP3.2 Tanja Välisalo: Named Entity Recognition for NARC Data

15.10-15.15 WP4.3 Eetu Mäkelä: Evaluation and Subsetting

15.15-15.20 W4.1 Julia Matveeva: Metadata Harmonization

15.20-15.25 WP4.4 Mikko Laitinen: Twitter

15.25-15.30 WP4.2 Eero Hyvönen: LOD

15.30-15.35 WP3.4 Raine Koskimaa: Game Streams

15.35-15.40 WP3.3 Maria Valaste: Qualitative Surveys

15.40-15.45 WP3.5 Kimmo Elo (Risto Turunen replacing): Text Networks

15.45-15.50 WP5 Sanna Kumpulainen: Evidence-based RI Development + Education & Resources

16.00-17.00 Free Chilling & Refreshments / Parallel session: Executive Board Meeting (with Zoom option)

 

 

Tule mukaan verkkokurssille Korpuslingvistiikka ja tilastolliset menetelmät (4.9.-20.10.2023)

Verkkokurssi Korpuslingvistiikka ja tilastolliset menetelmät on suunnattu kieliaineiden ja muiden aineiden opiskelijoille, jotka haluavat oppia korpusten käytön perusteet.

Kurssi on tarjolla sekä suomeksi että englanniksi ja se on avoin kaikille yliopisto-opiskelijoille Suomessa ja Suomen ulkopuolella. Kurssi alkoi maanantaina 4.9., mutta kurssialueelle on mahdollista liittyä osallistujamäärän salliessa vielä 15.9. saakka.

Lue lisää ja ilmoittaudu mukaan!

 

Huom. Sama kurssi järjestetään uudelleen seuraavan kerran 3. periodissa, 15.1.2024 alkaen (ks. kurssisivu).

Tutkijat selvittivät Lahjoita puhetta -aineiston avulla tyypillisen sävelkorkeuden yli 8000 suomenpuhujan puheesta

Kansainvälinen INTERSPEECH 2023 -konferenssi järjestettiin 20.-24. elokuuta Dublinissa, Irlannissa. Mietta Lennes piti konferenssissa posteriesitelmän, joka perustui seuraavaan englanninkieliseen konferenssiartikkeliin:

Lennes, M., Toivola, M. (2023). Pitch distributions in a very large corpus of spontaneous Finnish speech. Proceedings of INTERSPEECH 2023, 4778-4782, doi: 10.21437/Interspeech.2023-1822.

Tutustu englanninkieliseen posteriin

<< FIN-CLARIAH Overview

FIN-CLARIAH Summer Event 6.6.2023 11-17

Place: CSC, Life Science Centre, Keilaranta 14 C, Espoo

 

 

Preliminary Program

11.00-11.10 Welcoming Words by Katri Tegel, Development Manager, CSC

11.10-12.00 Keynote: Mikko Kurimo, Professor of Speech and Language Processing, Aalto University

12.00-13.00 Lunch

13.00-15.00 Thematic Groups

  1. DH Education:
    This group gathers together people who are interested in DH education: how can we disseminate our RI services to Finnish SSH communities through education, both in the short and long term?
  2. Documentation:
    This group develops best practices for documentation inside the project: what is the quality we want to reach by the end of the year, and how our documentation varies in different contexts (e.g., graphical user interfaces versus code repositories)?
  3. Speech Data in Research:
    This group discusses the needs of researchers using speech data: what is the state-of-the-art, and how is FIN-CLARIAH going to push the field further?
  4. Visual Sources in Research:
    This group discusses the needs of researchers using visual sources (videos, images, photos): what is the state-of-the-art, and how is FIN-CLARIAH going to push the field further?

15.00-15.30 Coffee

15.30-16.15 Sharing the Results from the Groups

16.15-17.00 Free Chilling & Refreshments / Parallel session: Executive Board Meeting (with Zoom option)

 

FIN-CLARIAH Workshop Day 18.11.2022 11-17 @ University of Jyväskylä

<< FIN-CLARIAH Overview

Workshop Program

11.00-12.00 Jari Ojala: Welcoming words + Pasi Tyrväinen: Keynote

12.00-13.00 Lunch

13.00-13.15 Anna Sendra Toset: Results from FIN-CLARIAH interviews

13.15-14.30 Teamwork in thematic groups:

  1. CSC integration – Slides (Martin Matthiesen)
  2. Data licensing – Slides (Mietta Lennes)
  3. The end-user perspective I (Eetu Mäkelä)
  4. The end-user perspective II  (Mikko Laitinen)

14.30-15.00 Coffee 

15.00-16.00

  • Reports from thematic groups
  • Mikko Tolonen: Why metadata matters in FIN-CLARIAH? (Slides)
  • General discussion 

16.00-17.00 Socializing & refreshments (Executive board meeting)

 

Löydä tehokkaita työskentelytapoja ja suunnittele aineistosi hallintaa Data Clinic -kurssilla!

Avoin verkkokurssi Data Clinic käynnistyy 11.11.2022 ja jatkuu huhtikuun 2023 lopulle. Talven ja kevään aikana opit kirjoittamaan oman aineistonhallintasuunnitelman (Data Management Plan, DMP) ja saat käytännön tukea ja neuvontaa aineistosi keräämiseen, käsittelyyn ja hallintaan. Opiskelu tapahtuu lähtökohtaisesti etänä, osin itsenäisesti ja osin pienissä vertaisryhmissä.

Kurssimateriaalit tarjotaan pääosin englanniksi. Kaikkien yliopistojen ja tieteenalojen opiskelijat ovat sallitun opiskelijamäärän rajoissa tervetulleita. Ainoa esivaatimus on, että olet aloittamassa tutkimusta, jossa sinun pitää käsitellä ja hallita juoksevaa tekstiä ja/tai puhetallenteita sisältävää aineistoa (ts. kieliaineistoa).

Lue lisää ja tule mukaan kurssille 28.11. mennessä!

Avoin verkkokurssi Puheen analyysin perusteet 31.10.–12.12.2022

Verkkokurssilla otetaan haltuun perustyökalut puhenäytteiden litterointiin, transkribointiin ja tutkimiseen ja opitaan oman puhekorpuksen suunnittelun ja hallinnan periaatteita. Kurssin aikana käytetään aktiivisesti Praat-ohjelmaa ja tutustutaan myös ELANiin.

Kurssi on avoin kaikkien yliopistojen opiskelijoille ja sen voi suorittaa joko suomeksi tai englanniksi. Osallistujamäärää saatetaan kuitenkin tarvittaessa rajoittaa. Opettajina toimivat Mietta Lennes ja Juraj Šimko Helsingin yliopistosta.

Kurssi on alkanut, mutta mukaan ehtii liittyä vielä perjantaihin 11.11.2022 saakka.

Lisätietoa ja liittyminen Moodle-alueelle

FIN-CLARIAH Kick-off 3.6.2022

<< FIN-CLARIAH Overview

Posters presented in the kick-off event – Avajaistilaisuudessa esiteltävät posterit

To view or download the PDF version, click on the image.

W1.1 Text processing and annotation environments

Image of the poster W1.1 Text processing and annotation environments
Top of page

W1.2 Speech processing and annotation

Image of the poster W1.2 Speech processing and annotation
Top of page

W1.3 Noise-tolerant NLP

Image of the poster W1.3 Noise-tolerant NLP
Top of page

W2.1 Social Data Science

Image of the poster W2.1 Social Data Science
Top of page

W2.2 Learners’ Assessment Environments

Image of the poster W2.2 Learners' Assessment Environments
Top of page

W2.3 Translation and Interpretation

Image of the poster W2.3 Translation and Interpretation
Top of page

W2.4 Terminology

Image of the poster W2.4 Terminology
Top of page

W2.5 Solutions for better use of language learner performances in research

Image of the poster W2.5 Solutions for better use of language learner performances in research
Top of page

W3.1 Increasingly automated ingestion of material

Image of the poster W3.1 Increasingly automated ingestion of material
Top of page

W3.2 AI solutions to better use of National Archives mass digitisation services

Image of the poster W3.2 AI solutions to better use of National Archives mass digitisation services
Top of page

W3.3 Qualitative survey data

Image of the poster W3.3 Qualitative survey data
Top of page

W3.4 Analysis tools for real-time chats in gameplay streams

Image of the poster W3.4 Analysis tools for real-time chats in gameplay streams
Top of page

W3.5 Text network analysis of political texts

Image of the poster W3.5 Text network analysis of political texts
Top of page

W4.1 Metadata harmonization and analysis

Image of the poster W4.1 Metadata harmonization and analysis
Top of page

W4.2 Linked Open Data Services

Image of the poster W4.2 Linked Open Data Services
Top of page

W4.3 Subsetting and evaluating data

Image of the poster W4.3 Subsetting and evaluating data
Top of page

W4.4 Social media noise (and how to tackle it?)

Image of the poster W4.4 Social media noise (and how to tackle it?)
Top of page

W5.1 & 5.2 Information interaction

Image of the poster W5.1 & 5.2 Information interaction

Top of page

Kielipankki esittäytyy jälleen Langnetin kesäkoulussa

Mietta Lennes esittelee Kielipankkia ja kertoo kieliaineistojen arkistoinnin käytänteistä Langnetin kesäkoulussa 15.8. klo 14-15.

Katso lisätiedot ja lataa esityksen diat tapahtumakalenterista!

FIN-CLARIAH-aiheisia postereita

FIN-CLARIAH-infrastruktuurihankkeen aloitustapaaminen pidetään Kansalliskirjastossa 3.6.2022. Tilaisuudessa esiteltäviä postereita voi käydä ihailemassa tapahtumasivulla.

Tervetuloa verkkokurssille Korpuslingvistiikka ja tilastolliset menetelmät

Verkkokurssi Korpuslingvistiikka ja tilastolliset menetelmät (Corpus Linguistics and Statistical Methods) järjestetään jälleen 17.1.–6.3.2022. Kurssin voi suorittaa joko suomen- tai englanninkielisenä.

Osallistujamäärä on rajoitettu, mutta tilan salliessa kurssille voivat osallistua myös muiden kuin Helsingin yliopiston opiskelijat ja ulkomailtakin voidaan hyväksyä osallistujia. Helsingin yliopiston opiskelijat ilmoittautuvat tavalliseen tapaan Sisussa. Helsingin yliopiston ulkopuolisten opiskelijoiden ilmoittautuminen tapahtuu liittymällä suoraan kurssin Moodle-alueelle. Linkki Moodleen ja lisätiedot löytyvät kurssin kotisivulta.

Kurssille voi liittyä vielä 28.1.2022 saakka (ellei osallistujien maksimimäärä täyty ennen sitä).

Kurssin kotisivu

 

Muut Kielipankin järjestämät kurssit ja koulutukset

Lahjoita puhetta -kampanja palkittiin PRIX EUROPAlla: Vuoden 2021 paras eurooppalainen digitaalinen audioprojekti

Lahjoita puhetta -kampanja, jonka suunnittelussa Kielipankki on ollut mukana, palkittiin vuoden 2021 Prix Europa-festivaalilla sarjassa Best European Digital Audio Project of the Year 2021. Voittajat julkistettiin Saksan Potsdamissa 15.10.2021. Lue Ylen sivuilta lisää Prix Europa -palkinnosta: https://yle.fi/aihe/a/20-10001451

Aiemmin tänä vuonna Lahjoita puhetta on voittanut parhaan mobiilipalvelun palkinnon sekä kunniamaininnan parhaasta datan käytöstä digitaalisen median Grand One -gaalassa (linkki Ylen sivuille).

Lahjoita puhetta on Ylen, Valtion kehitysyhtiö Vaken (nykyinen Ilmastorahasto), Solitan, Aalto-yliopiston ja Helsingin yliopiston yhteinen hanke.

 

Tästä voit lahjoittaa puhettasi!

Helsingin yliopiston avoimen tieteen palkinto 2021 myönnettiin Kielipankille ja Lahjoita puhetta -kampanjalle

Helsingin yliopisto myönsi 29.10.2021 Kielipankille ja Lahjoita puhetta -kampanjalle avoimen tieteen palkinnon tunnustuksena tutkimusaineistojen avaamisen ja uudelleenkäytettävyyden edistämisestä. Kielipankin lisäksi palkinnon sai tutkimuskoordinaattori Kati Lassila-Perini.

Lokakuun lopussa pidetyssä palkintoseremoniassa tutkimusjohtaja Krister Lindén piti esityksen, joka on nyt saatavilla YouTubessa englanniksi tekstitettynä. Lisätietoa palkinnosta löytyy Helsingin yliopiston verkkosivuilta.

Löydä tehokkaita työskentelytapoja ja suunnittele aineistosi hallintaa Data Clinic -kurssilla!

Avoin verkkokurssi Data Clinic käynnistyy 12.11.2021 ja jatkuu huhtikuun 2022 lopulle. Talven ja kevään aikana opit kirjoittamaan aineistonhallintasuunnitelman ja saat käytännön tukea ja neuvontaa oman aineistosi keräämiseen, käsittelyyn ja hallintaan.

Kurssimateriaalit tarjotaan pääosin englanniksi. Kaikkien yliopistojen ja tieteenalojen opiskelijat ovat sallitun opiskelijamäärän rajoissa tervetulleita. Ainoa esivaatimus on, että olet jo aloittamassa tutkimushanketta, jossa sinun pitää käsitellä ja hallita tekstiä tai puhetallenteita sisältävää aineistoa (ts. kieliaineistoa).

Lue lisää ja tule mukaan kurssille!

Avoin verkkokurssi Puheen analyysin perusteet 1.11.-17.12.2021

Verkkokurssilla otetaan haltuun perustyökalut puhenäytteiden litterointiin, transkribointiin ja tutkimiseen ja opitaan oman puhekorpuksen suunnittelun ja hallinnan periaatteita. Kurssin aikana käytetään aktiivisesti Praat-ohjelmaa ja tutustutaan myös ELANiin.

Kurssi on avoin kaikkien yliopistojen opiskelijoille ja sen voi suorittaa joko suomeksi tai englanniksi. Osallistujamäärää saatetaan kuitenkin tarvittaessa rajoittaa. Opettajina toimivat Mietta Lennes ja Juraj Šimko Helsingin yliopistosta.

Kurssille voi ilmoittautua 12.11. saakka.

Lisätietoa ja liittyminen Moodle-alueelle

Vielä ehdit ilmoittautua luonnollisen kielen käsittelyn verkkokurssille

Tuomo Hiippala pitää Helsingin yliopistossa verkkokurssin Natural Language Processing for Linguists ajalla 15.3.2021 -10.5.2021.

Kurssi on laajuudeltaan 5 op ja sille ovat tervetulleita myös muiden kuin Helsingin yliopiston opiskelijat. Ilmoittaudu 16.3.2021 mennessä.

Kurssilla käytettävää oppimateriaalia voit hyödyntää, vaikket itse ehtisikään tällä kertaa kurssin kyytiin!

Kurssin tarkemmat tiedot

 

Tervetuloa seuraavaan Kielipankki Liveen 14.12. klo 13-15

Seuraava Kielipankki Live pidetään maanantaina 14.12. klo 13.00 alkaen englanninkielisenä Zoomin välityksellä. Aiheena tällä kertaa erityisesti puheaineistot ja tietosuojakäytänteet, esiintyjinä asiantuntevia tutkijavieraita. Tule mukaan kysymään ja keskustelemaan! Ilmoittautumisia pyydetään mieluiten 11.12. mennessä.

Ohjelma ja lisätiedot

Kielipankki Live 24.8.2020

In English

<< Kielipankki Live -tapahtumien pääsivu

Ensimmäinen Kielipankki Live järjestettiin 24.8.2020 klo 13-15. Tilaisuus pidettiin suomeksi ja juontajana toimi projektisuunnittelija Mietta Lennes. Tapahtuman keskeiset osat ovat katsottavissa YouTubessa (videoiden tekstitykset tulossa myöhemmin). Esitysten materiaalit ovat saatavilla ohjelman kohdalta.

Kun haluat pysyä ajan tasalla Kielipankki Live -tilaisuuksista ja muista Kielipankin uutisista, tilaa uutiskirje. Katso myös Kielipankin esittely!

Kielipankki Live 24.8. klo 13-15

Tapahtuman keskeiset osat ovat katsottavissa YouTubessa. Lisäksi esitysten materiaalit ovat saatavilla ohjelman kohdalta.


Jani Marjanen

Kaikkien aikojen ensimmäisen Kielipankki Live -tapahtuman vieraana on Pohjoismaiden historian tutkija Jani Marjanen.
Lahjoita puhetta

Lahjoita puhetta
-kampanjassa kerätään monipuolista puheaineistoa sekä tutkijoiden että yritysten käyttöön.
Korp-palvelu

Kielipankin Korp-hakupalvelu
päivittyy – kysymme Jyrki Niemeltä, mitä uutta on luvassa.

Ohjelma

<< Kielipankki Live -tapahtumien pääsivu

In English

 

European Language Grid (ELG): esittely ja yleiskatsaus

ELG:n neljäs alueellinen työpaja: Suomi

15.12.2020 klo 14.00-16.30
Verkkotapahtuma

 

European Language Grid (ELG) kehittää digitaalista markkinapaikkaa, jonka kautta eurooppalaiset yritykset, organisaatiot ja kansalaiset voivat sekä tarjota että tehokkaasti käyttää kieliteknologisia työkaluja, datasettejä ja palveluita. Joulukuussa järjestettävän työpajan tavoitteena on esitellä ELG:n toimintaperiaatetta ja kertoa pilottihankkeiden etenemisestä. Tervetuloa keskustelemaan siitä, mitä ELG tarjoaa sinulle!

Ilmoittautuminen

ELG-työpaja on ilmainen tapahtuma, mutta siihen on ilmoittauduttava ennakkoon. Ilmoittaudu ELRC:n verkkosivujen kautta 10.12.2020 mennessä. Huom. Ilmoittautumisen lisätiedoissa voit mainita, mikäli olet kiinnostunut osallistumaan ELG-tutoriaaliin työpajan lopussa!

Huomaa, että aiemmin samana päivänä klo 9.30-12.40 järjestetään myös Suomen kolmas ELRC-työpaja. Samalla lomakkeella voit ilmoittautua mukaan molempiin verkkotapahtumiin.

Ohjelma (muutokset mahdollisia)

ELG-työpaja järjestetään englanninkielisenä.

14:00Welcome and introduction
14:05ELG Overview
Katrin Marheinecke
14:30ELG online demo
Nils Feldhus
14:50Presentations of Finnish Pilot Projects funded in ELG: PARA4DLM (University of Turku), LSDISCO (Lingsoft); OPUS-MT (University of Helsinki)
15:20Expectations/requirements of Finnish Language Technology providers
Marko Turpeinen, 1001Lakes
15:40Summary and discussion
16:00End of workshop
16:15Tutorial: How to integrate a service into ELG
This tutorial may be organized according to requests from the participants. Please indicate your interest in the registration form.

Viimeksi päivitetty: 7.12.2020

Hae Kielipankki-portaalista:
Tanja Säily
Kuukauden tutkija: Tanja Säily

 

Tulevat tapahtumat


Yhteystiedot

Kielipankin tekninen ylläpito:
kielipankki (ät) csc.fi
p. 09 4572001

Aineistoihin ja muuhun sisältöön liittyvät asiat:
fin-clarin (ät) helsinki.fi
p. 029 4129317

Tarkemmat yhteystiedot