Kielipankin uutiskirje 1/2024

In English

Kuukauden tutkija -sarja saavutti virstanpylvään

Keväästä 2016 alkaen Kielipankki on julkaissut verkkosivuillaan säännöllisesti Kuukauden tutkija -sarjaa, jossa eri alojen tutkijat pääsevät esittelemään työtään ja kertomaan käyttämistään Kielipankin aineistoista. Nyt juhlitaan jo sadatta tutkijaesittelyä!

Kuukauden tutkijat vuonna 2024

  1. Liisa Mustanoja – sosiolingvistiikka, sosiofonetiikka, Tampereen puhekieli
  2. Tanja Säily – englannin kielen vaihtelu ja muutos, historiallinen korpuslingvistiikka
  3. Harri Uusitalo – historiallinen kielentutkimus, ekolingvistiikka
  4. Lotta Leiwo – folkloristiikka, T-Bone Slim -korpus
  5. Juraj Šimko – fonetiikka, puhesynteesi
  6. Krister Lindén – Kielipankki (100. tutkijaesittely)

Myös aikaisemmat tutkijaesittelyt löytyvät arkistosta.

Tiedätkö tutkijoita, joka käyttävät Kielipankkia ja sopisivat kuukauden tutkijoiksi? Olisitko ehkä itse yksi heistä? Ehdota meille: https://www.kielipankki.fi/tuki/ota-yhteytta/

Uusia, päivitettyjä ja laajennettuja aineistoja vuonna 2024

Uusia tai päivitettyjä työkaluja vuonna 2024

Uusia aineistoja odotettavissa syksyllä

  • Kansalliskirjaston sanoma- ja aikakauslehtikorpuksen ruotsinkielisen osakorpuksen versiota 2 valmistellaan parhaillaan Korp-palvelua varten.
  • Alkusyksyllä on tarkoitus julkaista uutta viittomakielen aineistoa sisältävä päivitys CFinSL-korpukseen.
  • Suomi 24 -korpukseen on valmisteilla monien odottama päivitys, joka sisältää keskustelufoorumin viestit vuosilta 2021-2023.
  • Tulossa on myös mm. Satakunnan ja Tampereen puhekieltä sisältäviä korpuksia.

Metadatan tallennusalusta on vaihtunut

Kielipankki ylläpitää kuvailutietueita kaikista välittämistään aineistoista. Jokaisella yksittäisellä aineistoversiolla on oma kuvailutietue, jolla on pysyvä tunniste.

Kielipankissa on käytetty kuvailutietojen tarjoamiseen META-SHARE-nimistä alustaa, mutta sen tuki on loppunut. Kielipankin kaikki nykyiset kuvailutietueet on siirretty norjalaisen CLARIN-keskuksen, CLARINO Bergenin ylläpitämälle COMEDI-alustalle. Kaikkien Kielipankin hoitamien kuvailutietueiden pysyvät tunnisteet on automaattisesti ohjattu uusiin osoitteisiin COMEDIssa.

Huomaathan, että vaikka kuvailutietueet näyttävät nyt vähän erilaisilta, itse aineistojen sisältö tai sijainti eivät ole muuttuneet.

Korpin uudistus loppusuoralla

Tehokkuuden parantamiseksi Korp-palvelu siirrettiin uudelle palvelimelle tämän vuoden alussa. Korp-ohjelmistoon on myös tulossa syksyllä laaja päivitys, jota on valmisteltu pitkään. Päivityksen myötä suomalaisessa Kielipankissa tarjottava Korp-alustan versio on jatkossa helpompi pitää yhdenmukaisena Ruotsin Språkbankenissa kehitettävän Korp-alustan kanssa.

Mylly-palvelu on poistunut käytöstä

Vähäisestä käytöstä johtuen Mylly-palvelu on nyt ajettu alas. Jos sinulla on Myllyssä aineisto, jonka haluat ottaa talteen itsellesi tai jos haluat hyödyntää Myllyn työkaluskriptejä muilla alustoilla, lue toimintaohjeet täältä.

Kielipankin suosittelemat tiedostoformaatit

Kielipankki on ryhtynyt ylläpitämään CLARINin Standards Information System -järjestelmässä luetteloa tiedostomuodoista, joita Kielipankki tukee ja suosittelee kielivarojen tallentamiseen. Jos huomaat puutteita, lähetäthän palautetta.

Haluatko tarjota omaa aineistoasi Kielipankin välitettäväksi?

Ilmoita oman uuden aineistosi perustiedot Kielipankille: http://urn.fi/urn:nbn:fi:lb-2021121421

Kurssit ja oppimateriaalit

Verkkokurssi Korpuslingvistiikka ja tilastolliset menetelmät (5 op) järjestetään seuraavan kerran 1. periodilla syys-lokakuussa 2024 ja uudelleen taas keväällä 2025. Syksyn 2. periodilla pidetään kurssi Puheen analyysin perusteet, ja marraskuussa käynnistyy  gradu- tai väitöskirja-aineistoa suunnitteleville englanninkielinen kurssi Data Clinic. Verkkokurssit ovat avoimia kaikkien yliopistojen opiskelijoille.

Viimeaikaisia tapahtumia:

FIN-CLARIAH-tutkimusinfrastruktuurin kesäkuulumiset

FIN-CLARIAH koostuu kahdesta osasta, FIN-CLARINista ja DARIAH-FI:stä. Yhteishankkeen väki kokoontui 10.6.2024 Helsingissä pidettyyn työpajaan, jossa keskusteltiin tekoälyn tuomista mahdollisuuksista ihmistieteiden tutkimiseen. Lisäksi FIN-CLARIAH-hankkeen tavoitteita hahmoteltiin postereihin, jotka ovat esillä Kielipankin verkkosivuilla.

Kielipankki osallistui LREC-COLING 2024 -konferenssin työpajoihin

Kielipankin henkilökunta oli valmistellut esitelmiä Torinossa järjestettyyn LREC-COLING 2024 -konferenssin työpajoihin. Jussi Piitulainen piti ParlaCLARIN IV -työpajassa esitelmän ”Investigating Multilinguality in the Plenary Sessions of the Parliament of Finland with Automatic Language Identification” ja Tommi Jauhiainen SIGUL 2024 -työpajassa esitelmän ”Improving Language Coverage on HeLI-OTS”. Esitelmissä kuvatut uudet kielet ja parannetut kielimallit löytyvät osana tänä keväänä julkaistua HeLI-OTS 2.0 kielentunnistinta.

European Language Data Space (LDS) -työpaja järjestettiin Helsingissä

European Language Data Space (LDS) ja Helsingin yliopisto kokosivat yhteen suomalaisen teollisuuden, julkishallinnon ja tutkimuksen asiantuntijoita keskustelemaan kielidatan merkityksestä kieliteknologioiden ja tekoälypohjaisten työkalujen kehittämiselle Suomessa. Työpajan tarkoituksena oli lisätä suomalaisten toimijoiden tietoisuutta niin Euroopan komission tavoitteista kuin uusista liiketoiminnan mahdollisuuksista kielidatan kaupallistamisen suhteen. LDS-työpajan ohjelmaan voit tutustua tapahtumasivulla, jonne lisätään myöhemmin myös linkit tallenteisiin ja esitelmiin.

LDS-työpajaan oli kutsuttu paneelikeskustelijoiksi yritysten ja julkishallinnollisten organisaatioiden edustajia LAREINA-hankkeesta, jossa tavoitteena on kehittää puheentunnistusta ja puhesynteesiä suomen, suomenruotsin sekä saamen kielille.

CLARIN myöntää rahoitusta eri tarkoituksiin

Tiesitkö, että CLARINilta voi saada rahoitusta esimerkiksi tutkijoiden ja opettajien liikkuvuuteen tai tapahtumien ja koulutusten järjestämiseen? Tarkista rahoitusmuodot ja haut CLARINin sivuilta: https://www.clarin.eu/funding

Kielipankin henkilökunta lomailee ajalla 20.6.2024–4.8.2024

Kielipankki toivottaa kaikille rentouttavaa kesää!

Mietta Lennes ja Wilhelmina Dyster
projektisuunnittelijat
fin-clarin@helsinki.fi

 


Tilaa/peruuta Kielipankin uutiskirje: https://www.kielipankki.fi/kielipankki/uutiskirjeen-tilaus/

Katso myös CLARINin uutiskirje: https://www.clarin.eu/content/newsflash

Vaaleanpunainen kukka kaupunkiympäristössä

 

Kielipankin uutiskirje 2/2023

In English

Kuukauden tutkijat vuonna 2023

  1. Therese Lindström Tiedemann – svenska som andraspråk, pseudonymisering av språkliga data
  2. Maria Sarhemaa – etunimien appellatiivistuminen suomen kielessä
  3. Noora Hoffrén – konstruoitu toiminta suomalaisessa viittomakielessä ja suomen kielessä
  4. Johanna Vaattovaara – kielitietoisuus, kieliasenteet
  5. Rosa González Hautamäki – puhujakohtainen vaihtelu, äänimuuntelun vaikutukset
  6. Mikael Varjo – nollasubjektilauseet suomenkielisessä arkikeskustelussa
  7. Niina Kunnas – puhutun meänkielen korpus
  8. Nobufumi Inaba – kielenmuutos, vanhan kirjasuomen tutkimus
  9. Sampo Pyysalo – luonnollisen kielen käsittely, suuret kielimallit
  10. Anna Dmitrieva – selkokielistäminen
  11. Aleksi Sahala – muinaisten tekstien tutkimus
  12. Tiina Onikki-Rantajääskö – Tieteen termipankki

Myös aikaisemmat tutkijaesittelyt löytyvät arkistosta.

Tiedätkö tutkijoita, joka käyttävät Kielipankkia ja sopisivat kuukauden tutkijoiksi? Olisitko ehkä itse yksi heistä? Ehdota meille: https://www.kielipankki.fi/tuki/ota-yhteytta/

Uusia, päivitettyjä ja laajennettuja aineistoja vuonna 2023

Kansalliskirjaston lehtikokoelman (KLK) laajennuksia

Kansalliskirjaston sanoma- ja aikakauslehtikokoelman suomenkielinen osakorpuksen versio 2 , Korp (klk-fi-v2-korp) sisältää sanoma- ja aikakauslehtiä vuosilta 1771–2021 ja on kooltaan yhteensä yli 22 miljardia sanetta eli yli neljä kertaa niin paljon kuin edellisessä versiossa. Aineiston virkkeiden kieli on tunnistettu HeLI-OTS-kielentunnistimella. Kielipankissa työstetään parhaillaan myös KLK:n ruotsinkielistä osakorpusta Korp-palvelua varten. Lue lisää KLK:n laajennuksesta.

Korp muuttaa uudelle palvelimelle

Korp-palvelua siirretään parhaillaan uudelle palvelimelle suorituskyvyn parantamiseksi. Siirto saadaan päätökseen tammikuussa 2024. Korpissa näkyvät aineistot ja toiminnallisuudet pysyvät ennallaan, mutta haut nopeutuvat.

Myös Korp-ohjelmistoon on tekeillä merkittävä päivitys, joka valmistuu kevään 2024 aikana. Päivityksen myötä suomalaisessa Kielipankissa tarjottava Korp-alustan versio on jatkossa helpompi pitää yhdenmukaisena Ruotsin Språkbankenissa kehitettävän Korp-alustan kanssa.

Haluatko tarjota omaa aineistoasi Kielipankin välitettäväksi?

Ilmoita oman uuden aineistosi perustiedot Kielipankille: http://urn.fi/urn:nbn:fi:lb-2021121421

Ohje: Tutkimuskäyttöä koskevan tietosuojailmoituksen julkaiseminen

Kun ryhdyt käsittelemään Kielipankista saatua, henkilötietoja sisältävää aineistoa uuteen tarkoitukseen, sinun on tehtävä käsittelytarkoitusta koskeva tietosuojailmoitus, julkaistava se avoimesti sähköisessä muodossa ja toimitettava ilmoituksen linkki Kielipankille. Tietosuojailmoituksen tarkoituksena on auttaa rekisteröityjä ymmärtämään, millaisiin tarkoituksiin heidän tietojaan käytetään. Noudata henkilötietojen käsittelyssä aina oman organisaatiosi antamia tietosuojaohjeita. Kielipankki tarjoaa lisäksi ohjeen, joka helpottaa tietosuojailmoitukseen tarvittavien tietojen keräämistä. Lue lisää

Kurssit ja oppimateriaalit

Verkkokurssi Korpuslingvistiikka ja tilastolliset menetelmät (5 op) pidetään seuraavan kerran 3. periodilla tammi-helmikuussa 2024, jolloin sen voi suorittaa oman valinnan mukaan joko suomeksi tai englanniksi. Kurssi on avoin kaikkien yliopistojen opiskelijoille. Kurssin tarkemmat tiedot

FIN-CLARIAH-tutkimusinfrastruktuuri sai jatkorahoituksen kaudelle 2024–2025

Suomen Akatemian myöntämän uuden FIRI-rahoituksen myötä ihmistieteiden valtakunnallinen FIN-CLARIAH-tutkimusinfrastruktuuri pääsee jatkamaan toimintaansa myös vuosina 2024–25. FIN-CLARIAH koostuu kahdesta osasta, FIN-CLARINista ja DARIAH-FI:stä. Yhteishankkeen väki kokoontui 1.12.2023 Tampereella pidettyyn työpajaan, jossa keskusteltiin edellisten kahden toimintavuoden saavutuksista. Tutustu FIN-CLARIAH-hankkeen väliraportteihin Kielipankin verkkosivuilla.

ParlaCLARIN IV -tapahtuma Torinossa keväällä 2024: työpajoja, demoja ja esitelmäkutsu

Viime vuosien aikana CLARINin puitteissa on työstetty eri maiden laajoja eduskunta-aineistoja muotoon, joka mahdollistaa niiden monialaisen tutkimuksen. Eduskunta-aineistojen tutkijoita ja kehittäjiä kutsuu koolle ParlaCLARIN-työpaja, joka järjestetään keväällä Torinossa, Italiassa osana LREC2024-konferenssia (Language Resources and Evaluation Conference). Esitelmäkutsu on avoinna 19.2.2024 saakka. Lue lisää: https://www.clarin.eu/ParlaCLARIN-IV

CLARIN myöntää rahoitusta eri tarkoituksiin

Tiesitkö, että CLARINilta voi saada rahoitusta esimerkiksi tutkijoiden ja opettajien liikkuvuuteen tai tapahtumien ja koulutusten järjestämiseen? Tarkista rahoitusmuodot ja haut CLARINin sivuilta: https://www.clarin.eu/funding

Kielipankin uusi esittelyvideo on julkaistu

Lyhyessä esittelyvideossa (4 min 40 s) kerrotaan yleisesti Kielipankin aineistoista, työkaluista ja muista palveluista ja mahdollisuudesta oman aineiston tallettamiseen. Videossa on suomen- ja englanninkielinen tekstitys ja se löytyy Kielipankin YouTube-kanavalta. Videosta on tulossa myös toinen versio englanninkielisillä esimerkeillä.

Kielipankin henkilökunta lomailee ajalla 23.12.2023–7.1.2024

Kielipankki toivottaa kaikille rauhallista vuodenvaihdetta!

Mietta Lennes ja Wilhelmina Dyster
projektisuunnittelijat
fin-clarin@helsinki.fi

 


Tilaa/peruuta Kielipankin uutiskirje: https://www.kielipankki.fi/kielipankki/uutiskirjeen-tilaus/

Katso myös CLARINin uutiskirje: https://www.clarin.eu/content/newsflash

Luminen maisema vesialueelta, jonka rannalla on lauma lintuja

 

Kielipankin uutiskirje 1/2023

In English

Kuukauden tutkijat vuonna 2023

  1. Therese Lindström Tiedemann – svenska som andraspråk, pseudonymisering av språkliga data
  2. Maria Sarhemaa – etunimien appellatiivistuminen suomen kielessä
  3. Noora Hoffrén – konstruoitu toiminta suomalaisessa viittomakielessä ja suomen kielessä
  4. Johanna Vaattovaara – kielitietoisuus, kieliasenteet
  5. Rosa González Hautamäki – puhujakohtainen vaihtelu, äänimuuntelun vaikutukset
  6. Mikael Varjo – nollasubjektilauseet suomenkielisessä arkikeskustelussa

Myös aikaisemmat tutkijaesittelyt löytyvät arkistosta.

Tiedätkö tutkijoita, joka käyttävät Kielipankkia ja sopisivat kuukauden tutkijoiksi? Olisitko ehkä itse yksi heistä? Ehdota meille: https://www.kielipankki.fi/tuki/ota-yhteytta/

Uusia, päivitettyjä ja laajennettuja aineistoja vuonna 2023

Kansalliskirjaston lehtikokoelmaan (KLK) huomattava laajennus

Kansalliskirjaston sanoma- ja aikakauslehtikokoelman suomenkielinen osakorpus versio 2, Korp (klk-fi-v2-korp) on nyt käytettävissä beetatestiversiona Korpissa. Aineistoversio sisältää sanoma- ja aikakauslehtiä vuosilta 1771–2021 ja on kooltaan yhteensä yli 22 miljardia sanetta eli yli neljä kertaa niin paljon kuin aineiston edellisessä versiossa. Aineiston virkkeiden kieli on tunnistettu HeLI-OTS-kielentunnistimella. Lue lisää KLK:n laajennuksesta.

Haluatko tarjota omaa aineistoasi Kielipankin välitettäväksi?

Ilmoita oman uuden aineistosi perustiedot Kielipankille: http://urn.fi/urn:nbn:fi:lb-2021121421

Ohje: Tutkimuskäyttöä koskevan tietosuojailmoituksen julkaiseminen

Kun ryhdyt käsittelemään Kielipankista saatua, henkilötietoja sisältävää aineistoa uuteen tarkoitukseen, sinun on tehtävä käsittelytarkoitusta koskeva tietosuojailmoitus, julkaistava se avoimesti sähköisessä muodossa ja toimitettava ilmoituksen linkki Kielipankille. Tietosuojailmoituksen tarkoituksena on auttaa rekisteröityjä ymmärtämään, millaisiin tarkoituksiin heidän tietojaan käytetään. Noudata henkilötietojen käsittelyssä aina oman organisaatiosi antamia tietosuojaohjeita. Kielipankki tarjoaa lisäksi ohjeen, joka helpottaa tietosuojailmoitukseen tarvittavien tietojen keräämistä. Lue lisää

Kurssit ja oppimateriaalit

Verkkokurssi Korpuslingvistiikka ja tilastolliset menetelmät (5 op) pidetään seuraavan kerran 1. periodilla syys-lokakuussa 2023, jolloin sen voi suorittaa oman valinnan mukaan joko suomeksi tai englanniksi. Kurssi on avoin kaikkien yliopistojen opiskelijoille. Kurssin tarkemmat tiedot

FIN-CLARIAH-tutkimusinfrastruktuuri kokoontui kesäkuussa

Suomen Akatemian rahoittama valtakunnallinen ihmistieteiden tutkimusinfrastruktuuri FIN-CLARIAH koostuu kahdesta osasta, FIN-CLARIN ja DARIAH-FI. Yhteishankkeen väki kokoontui 6.6.2023 teematyöpajoihin CSC:n tiloihin Espooseen. Kielipankin verkkosivuilla voit tutustua FIN-CLARIAH-hankkeen väliraportteihin.

CLARIN myöntää rahoitusta eri tarkoituksiin

Tiesitkö, että CLARINilta voi saada rahoitusta esimerkiksi tutkijoiden ja opettajien liikkuvuuteen tai tapahtumien ja koulutusten järjestämiseen? Tarkista rahoitusmuodot ja haut CLARINin sivuilta: https://www.clarin.eu/funding

Kielipankin henkilökunta lomailee ajalla 23.6.–13.8.

mutta palvelemme myös kesällä ja vastaamme viesteihin mahdollisimman pian.

Kielipankki toivottaa kaikille rentouttavaa kesää!

Mietta Lennes
projektisuunnittelija
fin-clarin@helsinki.fi

 


Tilaa/peruuta Kielipankin uutiskirje: https://www.kielipankki.fi/kielipankki/uutiskirjeen-tilaus/

Katso myös CLARINin uutiskirje: https://www.clarin.eu/content/newsflash

Vaalea koira makaa laiturilla

 

Kielipankin uutiskirje 2/2022

In English

Kuukauden tutkijat vuonna 2022

  1. Jussi Ylikoski – suomalais-ugrilainen kielentutkimus, kielioppi, etymologia
  2. Tuisku Vilenius – saamelaisdiskurssit internetkeskusteluissa
  3. Ari Huhta – kielitaidon arviointi, vieraan ja toisen kielen oppiminen
  4. Terhi Ainiala – nimistöntutkimus, digitaaliset diskurssit
  5. Mika Hämäläinen – laskennallinen luovuus, uhanalaisten kielten kieliteknologia
  6. Jack Rueter – vähemmistökielten morfosyntaktinen kuvailu
  7. Sampsa Holopainen – uralilaisten kielten historia, etymologinen sanakirjatyö
  8. Filip Ginter – kieliteknologia, syväoppiminen, NLP
  9. Mikko Laitinen – sosiolingvistiikka, sosiaalisten verkostojen kielenkäyttö
  10. Benjamin Schweitzer – taidemusiikin erikoiskieli, korpuslingvistiset menetelmät
  11. Marjatta Palander – karjalan kielen puhekorpukset
  12. Marja-Liisa Helasvuo – suomen kielioppi, vuorovaikutus, suomalais-ugrilaisten kielten aineistot

Myös aikaisemmat tutkijaesittelyt löytyvät arkistosta.

Tiedätkö tutkijoita, joka käyttävät Kielipankkia ja sopisivat kuukauden tutkijoiksi? Olisitko ehkä itse yksi heistä? Ehdota meille: https://www.kielipankki.fi/tuki/ota-yhteytta/

Uusia aineistoja vuonna 2022

Päivitettyjä ja laajennettuja aineistoja vuonna 2022

Haluatko tarjota omaa aineistoasi Kielipankin välitettäväksi?

Ilmoita oman uuden aineistosi perustiedot Kielipankille: http://urn.fi/urn:nbn:fi:lb-2021121421

Lahjoita puhetta -kampanjassa kertyneen aineiston ensimmäinen versio on saatavilla akateemiseen tutkimuskäyttöön – pian myös yrityksille

Lahjoita puhetta -aineiston (”Puhelahjat”) ensimmäinen versio on kokoelma puhenäytteitä, jotka ovat kertyneet Lahjoita puhetta -kampanjassa aikavälillä 16.6.2020-14.9.2021. Versio sisältää noin 3200 tuntia puheäänitteitä, joista noin 1600 tuntia on käsin litteroitu tekstimuotoon.

Tutkijat voivat hakea pääsyä Kielipankista ladattavaan aineistoon. Puhelahjat-aineiston tutkimuskäyttö akateemisten organisaatioiden sisällä on maksutonta. Lisätietoa aineiston akateemisesta tutkimuskäytöstä

Yrityksillä ja muilla ei-akateemisilla organisaatioilla on mahdollisuus hankkia Puhelahjat-aineiston tai siitä tehtyjen pienempien osa-aineistojen maksullinen käyttöoikeus erillisellä lisenssisopimuksella. Osa maksullisista aineistopaketeista on vielä valmisteilla. Kiinnostuneet tahot voivat kysyä lisätietoja osoitteesta lahjoita-puhetta@helsinki.fi. Lisätietoa aineiston kaupallisesta käytöstä

Lahjoita puhetta -keruukampanja jatkuu toistaiseksi sekä suomen- että ruotsinkielisenä. Voit edelleen lahjoittaa puhettasi kummalla tahansa kielellä osoitteessa https://lahjoitapuhetta.fi/. Kun kampanja päättyy, loputkin aineistot toimitetaan saataville Kielipankin kautta.

Käytätkö Kielipankista saatua aineistoa, johon sisältyy henkilötietoja? Muista tietosuojailmoitus

Kun käytät mitä tahansa Kielipankin kautta saatua aineistoa, joka sisältää henkilötietoja (lisenssissä on merkintä ”+PRIV”), sinun tulee toimittaa oman hankkeesi yleistajuinen otsikko sekä linkki kyseistä käyttötarkoitusta koskevaan julkiseen tietosuojailmoitukseen Kielipankin julkaistaviksi. Toimita tiedot Kielipankille tällä lomakkeella.

Kirjoita tietosuojailmoitus kotiorganisaatiosi antamien ohjeiden mukaan. Ilmoitus kannattaa tallentaa paikkaan, jossa pystyt itse tarvittaessa päivittämään tietoja.

Tutustu myös henkilötietojen käsittelyä koskeviin Kielipankin ohjeisiin.

Uusi automaattinen litterointipalvelu Tekstiks on testikäytössä!

Uusi automaattinen litterointipalvelu Tekstiks on nyt testikäytössä. Palvelu tuottaa suomen- tai vironkielisestä puheäänitteestä tekstimuotoisen litteraatin, jota voi jälkikäteen muokata suoraan verkkoselaimella. Tekstiks-palvelu on kuitenkin vasta kehitteillä, joten sillä ei toistaiseksi pidä käsitellä luottamuksellisia tutkimusaineistoja eikä suuria määriä äänitteitä. Tekstiks-palvelu on syntynyt Tallinnan teknillisen korkeakoulun, Kielipankin ja Aalto-yliopiston välisenä yhteistyönä. Lue lisää Tekstiks-palvelusta

Kielipankki liittyi Mastodoniin

Kielipankki on nyt mukana avoimen lähdekoodin yhteisöpalvelussa Mastodonissa ja tiedottaa ajankohtaisista asioista myös sitä kautta. Tervetuloa seuraamaan meitä! Kielipankin Mastodon-tili: @kielipankki@toot.community

FIN-CLARIAH-tutkimusinfrastruktuuri kokoontui marraskuussa

Valtakunnallinen ihmistieteiden tutkimusinfrastruktuuri FIN-CLARIAH sai Suomen Akatemialta rahoituksen vuosille 2022-23. FIN-CLARIAH koostuu kahdesta osasta, FIN-CLARIN ja DARIAH-FI. Yhteishankkeen väki kokoontui 18.11.2022 työpajaan Jyväskylään. Kielipankin verkkosivuilla voit tutustua tapahtuman esitysmateriaaleihin sekä FIN-CLARIAH-hankkeen väliraportteihin.

CLARIN myöntää rahoitusta eri tarkoituksiin

Tiesitkö, että CLARINilta voi saada rahoitusta esimerkiksi tutkijoiden ja opettajien liikkuvuuteen tai tapahtumien ja koulutusten järjestämiseen? Tarkista rahoitusmuodot ja haut CLARINin sivuilta: https://www.clarin.eu/funding

Kielipankin henkilökunta lomailee 23.12.2022-8.1.2023.

Kielipankki toivottaa kaikille levollista joulun aikaa!

Mietta Lennes
projektisuunnittelija
fin-clarin@helsinki.fi

 


Tilaa/peruuta Kielipankin uutiskirje: https://www.kielipankki.fi/kielipankki/uutiskirjeen-tilaus/

Katso myös CLARINin uutiskirje: https://www.clarin.eu/content/newsflash

Virtaavaa vettä jään alla

 

Kielipankin uutiskirje

In English

Kuukauden tutkijat alkuvuonna 2022

  1. Jussi Ylikoski – suomalais-ugrilainen kielentutkimus, kielioppi, etymologia
  2. Tuisku Vilenius – saamelaisdiskurssit internetkeskusteluissa
  3. Ari Huhta – kielitaidon arviointi, vieraan ja toisen kielen oppiminen
  4. Terhi Ainiala – nimistöntutkimus, digitaaliset diskurssit
  5. Mika Hämäläinen – laskennallinen luovuus, uhanalaisten kielten kieliteknologia
  6. Jack Rueter – vähemmistökielten morfosyntaktinen kuvailu

Myös aikaisemmat tutkijaesittelyt löytyvät arkistosta.

Tiedätkö tutkijoita, joka käyttävät Kielipankkia ja sopisivat kuukauden tutkijoiksi? Olisitko ehkä itse yksi heistä? Ehdota meille: https://www.kielipankki.fi/tuki/ota-yhteytta/

Uusia aineistoja vuonna 2022

Päivitettyjä ja laajennettuja aineistoja vuonna 2022

Haluatko tarjota omaa aineistoasi Kielipankin välitettäväksi?

Ilmoita oman uuden aineistosi perustiedot Kielipankille: http://urn.fi/urn:nbn:fi:lb-2021121421

Yleiskäyttöinen HeLI-OTS-kielentunnistin julkaistu tutkimus–yritys-yhteistyönä

HeLI-OTS on yleiskäyttöinen kielentunnistin, joka pystyy automaattisesti tunnistamaan tekstin kielen, valiten sopivimman vaihtoehdon 200 kielen joukosta. Työkalu on ELG-yhteensopiva ja se on kehitetty osana Vaikuttavuussäätiön rahoittamaa Helsingin yliopiston ja Lingsoftin tekstin ja puheen kielentunnistukseen keskittyvää yhteistyöprojektia. Lue lisää

Kielipankin Korp-palvelun merkittävä päivitys

Korp on päivitetty versioon 9. Uudessa Korp-versiossa on korjausten lisäksi joitain uusia ominaisuuksia, joskin osa niistä tulee käyttöön vasta, kun aineistoihin lisätään niille tarvittava tuki. Toivomme palautetta uuden Korpin puutteista ja vioista (sekä toiveista) joko palautelomakkeen kautta tai sähköpostitse osoitteella fin-clarin (ät) helsinki.fi.

Lahjoita puhetta -kampanjan aineisto tulossa Kielipankkiin syksyllä 2022

Lahjoita puhetta -kampanja jatkuu edelleen. Tähän mennessä kertyneestä noin 4000 tunnin aineistosta on litteroitu käsityönä 1500 tuntia. Lahjoitettu puheaineisto on tulossa vuoden 2022 aikana tutkijoiden ja yritysten saataville rajattuihin käyttötarkoituksiin Kielipankin kautta. Näillä näkymin jakelu saadaan käynnistettyä syksyllä 2022 – tiedotamme asiasta, kun julkaisupäivä lähestyy!

CSC:n Kajaanin datakeskuksessa sijaitsevan LUMI-supertietokoneen avajaiset vietetty

LUMI on yhteiseurooppalainen, kymmenen Euroopan maan ja Euroopan unionin EuroHPC-yhteisyrityksen supertietokonehanke, joka parantaa Suomen ja koko Euroopan tutkimusta, työllisyyttä ja kilpailukykyä. Suomalaisten tutkijoiden ja yhteiskunnan käyttöön saatavasta laskentakapasiteetista jopa viidennes on yritysten käytettävissä. Lue lisää

CA18209 ”NexusLinguarum”: Virtual Mobility Grant

Lingvistiseen datatieteeseen keskittyvän COST Action ”NexusLinguarum” (CA18209) -tutkijaverkoston liikkuvuusrahaa voi hakea  30.6.2022 saakka. Virtual Mobility Grant -rahoituksen tarkoituksena on tukea hakijoita virtuaalisten, kansainvälistä verkostoitumista tai tutkimusyhteistyötä edistävien tapahtumien järjestämisessä, kunhan ne liittyvät NexusLinguarum-hankkeen aihepiiriin ja tavoitteisiin. NexusLinguarumin työryhmiin voi edelleen päästä jäseneksi. Lue lisää

CLARIN myöntää rahoitusta eri tarkoituksiin

Tiesitkö, että CLARINilta voi saada rahoitusta esimerkiksi tutkijoiden ja opettajien liikkuvuuteen tai tapahtumien ja koulutusten järjestämiseen? Tarkista rahoitusmuodot ja haut CLARINin sivuilta: https://www.clarin.eu/funding

FIN-CLARIAH-tutkimusinfrastruktuuri esitteli toimintaansa – tutustu postereihin!

Valtakunnallinen ihmistieteiden tutkimusinfrastruktuuri FIN-CLARIAH sai Suomen Akatemialta rahoituksen vuosille 2022-23. FIN-CLARIAH koostuu kahdesta osasta, FIN-CLARIN ja DARIAH-FI. Kesätapahtumassa tutkimusinfrastruktuurin toimintaan pääsi tutustumaan postereiden välityksellä, joihin voi tutustua täällä.

Lisätietoja FIN-CLARINista: FIN-CLARIN
Lisätietoja DARIAH-FIstä: DARIAH-FI
Katso myös FIN-CLARIAHin tiekartta: FIN-CLARIAH

Kielipankki toivottaa kaikille rentouttavaa kesää!

Mietta Lennes
projektisuunnittelija
fin-clarin@helsinki.fi

 


Tilaa/peruuta Kielipankin uutiskirje: https://www.kielipankki.fi/kielipankki/uutiskirjeen-tilaus/

Katso myös CLARINin uutiskirje: https://www.clarin.eu/content/newsflash

 

Neitoperhonen kasvin varrella

 

Kielipankin uutiskirje

Kuukauden tutkijat vuonna 2021

  1. Mats Fridlund – digitaalinen historia
  2. Emmi Lahti – retoriikka ja diskurssintutkimus
  3. Heikki Rasilo – puheen tuottaminen ja sen oppiminen
  4. Gwenaëlle Bauvois – oikeistopopulismi, vastamedia, uusinformaatio, hybridimedia ja totuudenjälkeisyys
  5. Mila Oiva – kulttuurihistoria
  6. Karita Suomalainen – vuorovaikutustilanteiden kieliopilliset rakenteet ja vihapuhe
  7. Olli Kuparinen – suomen kielen variaatio ja muutos
  8. Okko Räsänen – lapsen puheenkehityksen laskennallinen mallintaminen
  9. Juho Leinonen – puheen automaattinen tunnistaminen ja kohdistaminen, chattibotit
  10. Veronika Laippala – suuret kieliaineistot ja laskennalliset menetelmät
  11. Mikko Kurimo – automaattinen puheentunnistus
  12. Jutta Salminen – kiellon ilmaiseminen suomen kielessä

Myös aikaisemmat tutkijaesittelyt löytyvät arkistosta.

Tiedätkö tutkijoita, joka käyttävät Kielipankkia ja sopisivat kuukauden tutkijoiksi? Olisitko ehkä itse yksi heistä? Ehdota meille: https://www.kielipankki.fi/tuki/ota-yhteytta/

Aineistokohtaiset käyttöehdot ja tietosuojaehdot uudistuvat

Kielipankin aineistokohtaisiin käyttöehtoihin on alkuvuoden 2022 aikana tulossa joitakin tarkennuksia ja täydennyksiä. Näkyvimpänä muutoksena ovat aineistokohtaiset tietosuojaehdot, jotka lisätään kaikkien henkilötietoja sisältävien aineistojen käyttöehtoihin uutena osiona. Ilmoitamme käyttöehtojen päivityksistä erikseen Kielipankin verkkosivuilla. Lue lisää: https://www.kielipankki.fi/uutiset/aineistokohtaiset-kayttoehdot-ja-tietosuojaehdot-uudistuvat/

Uusia aineistoja vuonna 2021

Kielipankin käytöstä poistuneella LAT-alustalla olleet aineistot on siirretty latauspalveluun. Ladattavien aineistoversioiden sisältö on olennaisesti sama kuin LATissa ja niihin kuuluvia näytteitä voi tutkia esim. Praat- tai ELAN-ohjelmilla. Joitakin puheaineistoja on tarkoitus myöhemmin tuoda saataville myös Korp-palvelun kautta. Kunkin aineiston tilanne selviää kyseisen aineiston kuvailutietueesta ja aineistoryhmän verkkosivulta.

Haluatko tarjota omaa aineistoasi Kielipankin välitettäväksi?

Ilmoita oman uuden aineistosi perustiedot Kielipankille: http://urn.fi/urn:nbn:fi:lb-2021121421

Uutta: Aineistoryhmien sivut

Yksittäisestä aineistosta voi olla yhtä aikaa saatavilla useita erilaisia versioita, joista käyttäjä voi valita tarvitsemansa. Valinnan helpottamiseksi kustakin aineistosta tehdyt versiot ja muunnelmat on lueteltu aineistoryhmien tietosivuilla. Lue lisää

Kielipankin Korp-palvelu päivittyy pian

Testausvaiheessa ilmenneiden korjaustarpeiden vuoksi Korpin päivitys siirtyi tammikuulle, mutta monia uusia ominaisuuksia ja parannuksia pääsee jo kokeilemaan Korplabissa. Palaute on tervetullutta! Lue lisää

Aalto-ASR -työkalut puheentunnistukseen sekä tekstin ja puheen kohdistamiseen

Uudistunut Aalto-ASR 2.1 on asennettu ja testattavissa CSC:n Puhti-ympäristössä. Järjestelmän voi tarvittaessa asentaa myös omaan laitteistoon Docker-säiliöstä. Lue lisää

Kurssit ja oppimateriaalit

Verkkokurssi Korpuslingvistiikka ja tilastolliset menetelmät (5 op) pidetään seuraavan kerran 3. periodilla tammi-maaliskuussa 2021, jolloin sen voi suorittaa oman valinnan mukaan joko suomeksi tai englanniksi. Kurssi on avoin kaikkien yliopistojen opiskelijoille. Kurssin tarkemmat tiedot

CLARIN myöntää rahoitusta eri tarkoituksiin

Tiesitkö, että CLARINilta voi saada rahoitusta esimerkiksi tutkijoiden ja opettajien liikkuvuuteen tai tapahtumien ja koulutusten järjestämiseen? Tarkista rahoitusmuodot ja haut CLARINin sivuilta: https://www.clarin.eu/funding

Lahjoita puhetta -kampanja jatkuu – myös suomenruotsin keruu käynnissä

Lahjoita puhetta -kampanja jatkuu edelleen. Nyt voit lahjoittaa puhettasi myös ruotsiksi! Tähän mennessä kertyneestä noin 4000 tunnin aineistosta on litteroitu käsityönä 1500 tuntia. Lahjoitettu puheaineisto tulee keväällä 2022 tutkijoiden ja yritysten saataville rajattuihin käyttötarkoituksiin Kielipankin kautta.

Kielipankki, Yle ja Lahjoita puhetta -kampanja palkittiin kolmesti vuonna 2021

Suomen Akatemia myönsi uudelle FIN-CLARIAH-tutkimusinfrastruktuurille 4,6 miljoonaa euroa

Valtakunnallinen ihmistieteiden tutkimusinfrastruktuuri FIN-CLARIAH sai Suomen Akatemialta 4,6 miljoonan euron rahoituksen vuosille 2022-23. FIN-CLARIAH koostuu kahdesta osasta, FIN-CLARIN ja DARIAH-FI.

Lisätietoja FIN-CLARINista: FIN-CLARIN
Lisätietoja DARIAH-FIstä: DARIAH-FI
Katso myös FIN-CLARIAHin tiekartta: FIN-CLARIAH

Kielipankki toivottaa kaikille rauhallista joulunaikaa!

Mietta Lennes
projektisuunnittelija
fin-clarin@helsinki.fi

 


Tilaa/peruuta Kielipankin uutiskirje: https://www.kielipankki.fi/kielipankki/uutiskirjeen-tilaus/

Katso myös CLARINin uutiskirje: https://www.clarin.eu/content/newsflash

 

Luminen metsä ja ladut

 

News from the Language Bank of Finland, 3rd August 2017

(lisää…)

Uutisia Kielipankista 3.8.2017

(lisää…)

Uutisia Kielipankista 17.3.2017

(lisää…)

News from the Language Bank of Finland 13th December 2016

(lisää…)

Uutisia Kielipankista 13.12.2016

(lisää…)

News from the Language Bank of Finland 14th November 2016

(lisää…)

Uutisia Kielipankista 14.11.2016

(lisää…)

News from the Language Bank of Finland 14th October 2016

(lisää…)

Uutisia Kielipankista 14.10.2016

(lisää…)

News from the Language Bank of Finland 30th September 2016

(lisää…)

Uutisia Kielipankista 30.9.2016

(lisää…)

News from the Language Bank of Finland 13th September 2016

(lisää…)

Uutisia Kielipankista 13.9.2016

(lisää…)

News from the Language Bank of Finland 19th August 2016

(lisää…)

Hae Kielipankki-portaalista:
Aku Rouhe
Kuukauden tutkija: Aku Rouhe

 

Tulevat tapahtumat


Yhteystiedot

Kielipankin tekninen ylläpito:
kielipankki (ät) csc.fi
p. 09 4572001

Aineistoihin ja muuhun sisältöön liittyvät asiat:
fin-clarin (ät) helsinki.fi
p. 029 4129317

Tarkemmat yhteystiedot