IDA
Aineiston nimiName of corpusURNLisenssi URL (jos on)LisenssiLBR/Hae LupaDeposition agreementTyyppiIDASijainti: URN Sijainti: NimiDokumentaatioTekijäAuthorFirst publication dateKielipankki publication dateOther / Links
100suom
Sata suomalaista kielellistä elämäkertaa
Hundred Finnish Linguistic Life Stories
a
b
MP4,DOCX,XLSX
b
MP4,DOCX,XLSX
c
a
Bicon-quote-rightHanna Lappalainenhttps://blogs.helsinki.fi/100suomalaista/Sata suomalaista kielellistä elämäkertaaHundred Finnish Linguistic Life Storiesurn:nbn:fi:lb-2019092003
b
RES NC PRIV DEP OTHER
NoPYes
a
{Helsingin yliopisto}{University of Helsinki}2019https://blogs.helsinki.fi/100suomalaista/
Akkala
Puhutun ja kirjoitetun akkalansaamen korpus
The Corpus of Spoken and Written Akkala Saami
a
a
a
VRT
a
Korp
icon-quote-rightMichael RiesslerPuhutun ja kirjoitetun akkalansaamen korpusThe Corpus of Spoken and Written Akkala Saamiurn:nbn:fi:lb-2015111201NoT
a
Korp
amph-korp
Ajatella, miettiä, pohtia, harkita -korpuksen Helsinki-Korp-versio
amph-Corpus, Helsinki Korp Version
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightAntti ArppeAjatella, miettiä, pohtia, harkita -korpuksen Helsinki-Korp-versioamph-Corpus, Helsinki Korp Versionurn:nbn:fi:lb-2017022802
c
ACA NC
YesTNo
a
Korp
Antti ArppeAntti Arppe2008
coha-dl-2021
Corpus of Historical American English - Kielipankin ladattava versio 2021
Corpus of Historical American English - Kielipankki download version 2021
RES
R
a
icon-question-circleicon-quote-rightFIN-CLARINCorpus of Historical American English - Kielipankin ladattava versio 2021Corpus of Historical American English - Kielipankki download version 2021urn:nbn:fi:lb-2023030601http://urn.fi/urn:nbn:fi:lb-2017072507RES-fiT
a
http://urn.fi/urn:nbn:fi:lb-2017061924Mark DaviesMark Davies2023
coronavirus-ecorg-2021-05-src
The Coronavirus Corpus (Mark Davies, english-corpora.org) - Kielipankin versio 2021-05, lähdemateriaali
The Coronavirus Corpus (Mark Davies, english-corpora.org) - Kielipankki version 2021-05, source
RES
R
a
Bicon-quote-rightFIN-CLARINThe Coronavirus Corpus (Mark Davies, english-corpora.org) - Kielipankin versio 2021-05, lähdemateriaaliThe Coronavirus Corpus (Mark Davies, english-corpora.org) - Kielipankki version 2021-05, sourceurn:nbn:fi:lb-2022111701http://urn.fi/urn:nbn:fi:lb-2022111703RES-fiT
a
Mark DaviesMark Davies20202022
DIALUKI
DIALUKI - toisen ja vieraan kielen lukemisen ja kirjoittamisen diagnosointi
DIALUKI - Diagnosing reading and writing in a second or foreign language
RES
R
c
a
TXT
a
VRT
a
Korp
icon-quote-rightAri HuhtaDIALUKI - toisen ja vieraan kielen lukemisen ja kirjoittamisen diagnosointi DIALUKI - Diagnosing reading and writing in a second or foreign languageurn:nbn:fi:lb-20140730161http://urn.fi/urn:nbn:fi:lb-20150304138
c
RES NC DEP
YesT
a
Korp
digitala-autumn2021
DigiTala: lukioissa ja yliopistossa kerätty S2-aineisto, syksy 2021
DigiTala: L2 Finnish data from upper secondary schools and university, autumn 2021
RES
R
a
b
WAV, TXT
b
WAV, TXT
a
Bicon-quote-rightAnna von Zansenhttps://zenodo.org/communities/digitala/about/DigiTala: lukioissa ja yliopistossa kerätty S2-aineisto, syksy 2021 DigiTala: L2 Finnish data from upper secondary schools and university, autumn 2021urn:nbn:fi:lb-2023012625http://urn.fi/urn:nbn:fi:lb-2023012627
a
RES NC PRIV NORED DEP OTHER
NoPhttp://urn.fi/urn:nbn:fi:lb-2023012626
a
Anna von Zansen; Yaroslav Getman; Milla Sneck; Heini Kallio; Ragheb Al-Ghezi; Ekaterina Voskoboinik; Maria Kautonen; Ari Huhta; Mikko Kuronen; Mikko Kurimo; Raili HildénAnna von Zansen; Yaroslav Getman; Milla Sneck; Heini Kallio; Ragheb Al-Ghezi; Ekaterina Voskoboinik; Maria Kautonen; Ari Huhta; Mikko Kuronen; Mikko Kurimo; Raili Hildénhttps://zenodo.org/communities/digitala/about/
digitala-spring2021
DigiTala: lukioissa kerätty S2-aineisto, kevät 2021
DigiTala: L2 Finnish data from upper secondary schools, spring 2021
RES
R
a
b
WAV, TXT
b
WAV, TXT
a
Bicon-quote-rightAnna von Zansenhttps://zenodo.org/communities/digitala/about/DigiTala: lukioissa kerätty S2-aineisto, kevät 2021 DigiTala: L2 Finnish data from upper secondary schools, spring 2021urn:nbn:fi:lb-2023012621http://urn.fi/urn:nbn:fi:lb-2023012623
a
RES NC PRIV NORED DEP OTHER
NoPhttp://urn.fi/urn:nbn:fi:lb-2023012622
a
Anna von Zansen; Yaroslav Getman; Milla Sneck; Heini Kallio; Ragheb Al-Ghezi; Ekaterina Voskoboinik; Maria Kautonen; Ari Huhta; Mikko Kuronen; Mikko Kurimo; Raili HildénAnna von Zansen; Yaroslav Getman; Milla Sneck; Heini Kallio; Ragheb Al-Ghezi; Ekaterina Voskoboinik; Maria Kautonen; Ari Huhta; Mikko Kuronen; Mikko Kurimo; Raili Hildénhttps://zenodo.org/communities/digitala/about/
digitala-yki
DigiTalan YKI-aineisto
DigiTala's YKI data
RES
R
a
b
WAV, TXT
b
WAV, TXT
a
Bicon-quote-rightHeini Kalliohttps://zenodo.org/communities/digitala/about/DigiTalan YKI-aineistoDigiTala's YKI dataurn:nbn:fi:lb-2023012629http://urn.fi/urn:nbn:fi:lb-2023012631
a
RES NC PRIV NORED DEP OTHER
NoPhttp://urn.fi/urn:nbn:fi:lb-2023012630
a
Heini Kallio; Sari Ohranen; Tuija Hirvelä; Ari Huhta; Anna von Zansen; Yaroslav Getman; Ekaterina Voskoboinik; Ragheb Al-Ghezi; Milla Sneck; Mikko Kuronen; Mikko Kurimo; Raili HildénHeini Kallio; Sari Ohranen; Tuija Hirvelä; Ari Huhta; Anna von Zansen; Yaroslav Getman; Ekaterina Voskoboinik; Ragheb Al-Ghezi; Milla Sneck; Mikko Kuronen; Mikko Kurimo; Raili Hildénhttps://zenodo.org/communities/digitala/about/
dma-v2
Digitaalinen muoto-opin arkisto, uusi versio
Digital Morphology Archives, new version
PUB
P
c
VRT
b
a
Korp
icon-quote-rightDigitaalinen muoto-opin arkisto, uusi versioDigital Morphology Archives, new versionhttp://creativecommons.org/licenses/by/4.0/
c
PUB CC BY
YesTAlmost
a
Korp
{Helsingin yliopisto, suomen kielen, suomalais-ugrilaisten ja pohjoismaisten kielten ja kirjallisuuksien laitos}{University of Helsinki, The Department of Finnish, Finno-Ugrian and Scandinavian Studies}2003
dma-wn-fn-src
Muoto-opin arkiston sanaliput sekä keruukertomukset, lähdemateriaali
The Word Notes of the Morphology Archives with field reports, source
RES
R
c
PDF
c
icon-question-circleicon-quote-rightMuoto-opin arkiston sanaliput sekä keruukertomukset, lähdemateriaaliThe Word Notes of the Morphology Archives with field reports, sourceurn:nbn:fi:lb-2021083001http://urn.fi/urn:nbn:fi:lb-2016042201RES PRIV NDYesTYes
http://urn.fi/urn:nbn:fi:lb-2021061101{Helsingin yliopisto, suomen kielen, suomalais-ugrilaisten ja pohjoismaisten kielten ja kirjallisuuksien laitos}{University of Helsinki, The Department of Finnish, Finno-Ugrian and Scandinavian Studies}
dma-wn-src
Digitaalisen muoto-opin arkiston sanaliput, lähdemateriaali
The Word Notes of the Digital Morphology Archives, source
RES
R
c
a
PDF
c
a
icon-question-circleicon-quote-rightDigitaalisen muoto-opin arkiston sanaliput, lähdemateriaaliThe Word Notes of the Digital Morphology Archives, sourceurn:nbn:fi:lb-202005191http://urn.fi/urn:nbn:fi:lb-2016042201RES PRIV NDYesTYes
a
http://urn.fi/urn:nbn:fi:lb-2021061101{Helsingin yliopisto, suomen kielen, suomalais-ugrilaisten ja pohjoismaisten kielten ja kirjallisuuksien laitos}{University of Helsinki, The Department of Finnish, Finno-Ugrian and Scandinavian Studies}2003
DSPCON2013-2015-korp
Aalto-yliopiston DSP-kurssin keskustelukorpus 2013-2015, Helsinki-Korp-version
Aalto University DSP Course Conversation Corpus 2013-2015, Helsinki Korp Version
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightMikko Kurimo,
Seppo Enarvi
Aalto-yliopiston DSP-kurssin keskustelukorpus 2013-2015, Helsinki-Korp-versionAalto University DSP Course Conversation Corpus 2013-2015, Helsinki Korp Versionurn:nbn:fi:lb-2017030101
c
ACA NC DEP
YesTNo
a
Korp
{Aalto-yliopisto, Signaalinkäsittelyn ja akustiikan laitos}{Aalto University, Department of Signal Processing and Acoustics}2016
eduskunta-v2-dl
Eduskunnan täysistunnot, ladattava versio 2
Plenary Sessions of the Parliament of Finland, Downloadable Version 2
a
a
MP4, WAV, TXT
a
WAV, ELAN, VRT
a
a
icon-question-circleicon-quote-rightEduskunnan täysistunnot, ladattava versio 2Plenary Sessions of the Parliament of Finland, Downloadable Version 2
c
PUB BY (PRIV ND OTHER)
NoPNo
a
https://www.kielipankki.fi/aineistot/eduskunta/{Eduskunta}{The Parliament of Finland}
eduskunta-v2-korp
Eduskunnan täysistunnot, Kielipankin Korp-versio 2
Plenary Sessions of the Parliament of Finland, Kielipankki Korp Version 2
a
c
TXT
a
WAV, ELAN, VRT
a
a
Korp
icon-question-circleicon-quote-rightEduskunnan täysistunnot, Kielipankin Korp-versio 2Plenary Sessions of the Parliament of Finland, Kielipankki Korp Version 2
c
PUB BY (PRIV ND OTHER)
NoTNo
a
Korp
https://www.kielipankki.fi/aineistot/eduskunta/{Eduskunta}{The Parliament of Finland}
enets
Enetsin korpus
Enets Corpus
a
a
MP4, WAV, ELAN
a
MP4, WAV, ELAN
a
a
Download, Korp
icon-quote-rightOlesya KhaninaEnetsin korpusEnets Corpus
a
NoPNo
a
Download, Korp
Olesya KhaninaOlesya Khanina
english-uhlcs-korp
Englannin korpuksen (UHLCS) Helsinki-Korp-versio
English Corpus (UHLCS), Helsinki Korp Version
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightEnglannin korpuksen (UHLCS) Helsinki-Korp-versioEnglish Corpus (UHLCS), Helsinki Korp Versionurn:nbn:fi:lb-2017030701
c
RES NC LOC ND
YesTNo
a
Korp
Kristiina JokinenKristiina Jokinen2007
erme-dl
ERME Ersän ja mokšan laajennettu korpus, kokotekstit/ladattava versio
ERME Erzya and Moksha Extended Corpora, full text/download version
c
b
XML
b
VRT
icon-quote-rightJack RueterERME Ersän ja mokšan laajennettu korpus, kokotekstit/ladattava versioERME Erzya and Moksha Extended Corpora, full text/download version
c
ACA INF NC DEP
YesTJack Rueter; Olga YerinaJack Rueter; Olga Yerina
Ersä
Ersän puhekielen korpus
Corpus of Colloquial Erzya
c
c
a
ELAN
a
icon-quote-rightRiho GrünthalErsän puhekielen korpusCorpus of Colloquial Erzyaurn:nbn:fi:lb-2014073034
c
ACA INF NC DEP
YesP
a
erzya-moksha-komi-uhlcs-korp
Ersän ja mokšan kirjallisuutta ja julkaisuja ja komisyrjäänin kirjallisuutta (UHLCS), Helsinki-Korp-versio
Corpus of Erzya and Moksha Mordvin Literature and Journals and Komi Zyrian Literature (UHLCS), Helsinki Korp Version
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightErsän ja mokšan kirjallisuutta ja julkaisuja ja komisyrjäänin kirjallisuutta (UHLCS), Helsinki-Korp-versio Corpus of Erzya and Moksha Mordvin Literature and Journals and Komi Zyrian Literature (UHLCS), Helsinki Korp Versionurn:nbn:fi:lb-2017022816
c
RES NC LOC ND
YesTNo
a
Korp
Jack RueterJack Rueter2007
erzya-moksha-uhlcs-korp
Ersän ja mokšan sanaluettelokorpuksen (UHLCS) Helsinki-Korp-versio
Erzya and Moksha Mordvin Word List Corpus (UHLCS), Helsinki Korp Version
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightErsän ja mokšan sanaluettelokorpuksen (UHLCS) Helsinki-Korp-versioErzya and Moksha Mordvin Word List Corpus (UHLCS), Helsinki Korp Versionurn:nbn:fi:lb-2017022824
c
RES NC LOC ND
YesTNo
a
Korp
Dennis EstillDennis Estill2007
estonian1-uhlcs-korp
Viron korpus 1:n (UHLCS) Helsinki-Korp-versio
Estonian Corpus 1 (UHLCS), Helsinki Korp Version
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightViron korpus 1:n (UHLCS) Helsinki-Korp-versioEstonian Corpus 1 (UHLCS), Helsinki Korp Versionurn:nbn:fi:lb-2017022822
c
RES NC LOC ND
YesTNo
a
Korp
Kazuto MatsumuraKazuto Matsumura2007
estonian2-uhlcs-korp
Viron korpus 2:n (UHLCS) Helsinki-Korp-versio
Estonian Corpus 2 (UHLCS), Helsinki Korp Version
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightViron korpus 2:n (UHLCS) Helsinki-Korp-versioEstonian Corpus 2 (UHLCS), Helsinki Korp Versionurn:nbn:fi:lb-2017022823
c
RES NC LOC ND
YesTNo
a
Korp
Maria VilkunaMaria Vilkuna2007
fcaa
Keskusteluntutkimuksen arkisto
Finnish Conversation Analysis Archive
a
a
WAV,MP3,MP4,RTF,PDF
a
icon-quote-rightMari Siiroinenhttps://metashare.csc.fi/repository/browse/finnish-conversation-analysis-archive/65669f5eb7e611eb9cdefa163ec5ae3e69c8f5f510064ad999f16144700b1156/Keskusteluntutkimuksen arkistoFinnish Conversation Analysis ArchiveRES PRIVNoP
a
https://metashare.csc.fi/repository/browse/finnish-conversation-analysis-archive/65669f5eb7e611eb9cdefa163ec5ae3e69c8f5f510064ad999f16144700b1156/
fedidi
Murteita käsittelevien fennististen väitöskirjojen lähdetietokanta
Citation Database of Fennistic Dialect Dissertations
a
c
TXT
c
TXT
c
a
icon-quote-rightMurteita käsittelevien fennististen väitöskirjojen lähdetietokantaCitation Database of Fennistic Dialect Dissertationsurn:nbn:fi:lb-2018092801NoTYes
a
Lotta AarikkaLotta Aarikka
findarc
Suomenkielisen pimeän verkon kauppapaikka-aineisto
Finnish Dark Web Marketplace Corpus
RES
R
c
c
JSONLINE
b
VRT
a
Bicon-quote-rightTuomas HarviainenSuomenkielisen pimeän verkon kauppapaikka-aineistoFinnish Dark Web Marketplace Corpusurn:nbn:fi:lb-2022062221http://urn.fi/urn:nbn:fi:lb-2022062222
c
RES NC PRIV DEP OTHER
YesThttp://urn.fi/urn:nbn:fi:lb-2022062226
a
Tuomas HarviainenTuomas Harviainen
finears
Suomalaisen elektroakustisen musiikin haastatteluaineisto
Finnish electroacoustic music interviews
a
b
WAV,DOCX
b
WAV,TXT
a
icon-quote-rightMikko Ojanenhttps://blogs.helsinki.fi/finnish-electroacoustic-resources/Suomalaisen elektroakustisen musiikin haastatteluaineistoFinnish electroacoustic music interviewsurn:nbn:fi:lb-2020030421RES PRIVNoP
a
Mikko OjanenMikko Ojanenhttps://blogs.helsinki.fi/finnish-electroacoustic-resources/
FinIntas
The FinINTAS Corpus of Spontaneous and Read-aloud Finnish Speech
The FinINTAS Corpus of Spontaneous and Read-aloud Finnish Speech
a
c
wav + Praat
a
ELAN
a
icon-quote-rightMietta LennesThe FinINTAS Corpus of Spontaneous and Read-aloud Finnish SpeechThe FinINTAS Corpus of Spontaneous and Read-aloud Finnish Speechurn:nbn:fi:lb-20140730194
b
RES
NoP
a
finlangus
Amerikansuomalaisten siirtolaisten ja verrokkipuhujien puhuttu suomen kieli ja kielelliset tehtävät
Spoken language and linguistic tasks of Finnish-American immigrants and controls
a
icon-quote-rightNana LehtinenAmerikansuomalaisten siirtolaisten ja verrokkipuhujien puhuttu suomen kieli ja kielelliset tehtävätSpoken language and linguistic tasks of Finnish-American immigrants and controlsNoPNana LehtinenNana Lehtinen
finnish-bibles-uhlcs-korp
Suomen korpus (raamatut) (UHLCS), Helsinki-Korp-versio
Finnish Corpus (Bibles) (UHLCS), Helsinki Korp Version
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightSuomen korpus (raamatut) (UHLCS), Helsinki-Korp-versioFinnish Corpus (Bibles) (UHLCS), Helsinki Korp Versionurn:nbn:fi:lb-2017022820
c
RES NC LOC ND
YesTNo
a
Korp
Anssi Yli-JyräAnssi Yli-Jyrä2007
finnish-literature-uhlcs-korp
Suomen korpus (kirjallisuutta) (UHLCS), Helsinki-Korp-versio
Finnish Corpus (Literature) (UHLCS), Helsinki Korp Version
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightSuomen korpus (kirjallisuutta) (UHLCS), Helsinki-Korp-versioFinnish Corpus (Literature) (UHLCS), Helsinki Korp Versionurn:nbn:fi:lb-2017022821
c
RES NC LOC ND
YesTNo
a
Korp
Helsingin yliopistoUniversity of Helsinki2007
FinnTreeBank1-korp
Suomen puupankki FinnTreeBank 1:n Helsinki-Korp-versio
The Helsinki Korp Version of the Finnish TreeBank 1
PUB
P
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightSuomen puupankki FinnTreeBank 1:n Helsinki-Korp-versioThe Helsinki Korp Version of the Finnish TreeBank 1urn:nbn:fi:lb-2017030102https://creativecommons.org/licenses/by-nc-nd/4.0/legalcode
c
PUB CC BY
YesTNo
a
Korp
{Helsingin yliopisto}{University of Helsinki}2010
ha-korp
Ha-kieliaineiston Helsinki-Korp-versio
Ha Language Corpus, Helsinki Korp Version
PUB
P
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightLotta AunioHa-kieliaineiston Helsinki-Korp-versioHa Language Corpus, Helsinki Korp Versionurn:nbn:fi:lb-2017022101http://creativecommons.org/licenses/by/4.0/
c
PUB CC BY
YesTNo
a
Korp
Lotta AunioLotta Aunio
hanty-uhlcs-korp
Hantin korpus (pohjoishantin aineistot ja käännökset) (UHLCS), Helsinki-Korp-versio
Khanty Corpus (North Khanty, Corpora and Translations) (UHLCS), Helsinki Korp Version
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightHantin korpus (pohjoishantin aineistot ja käännökset) (UHLCS), Helsinki-Korp-versioKhanty Corpus (North Khanty, Corpora and Translations) (UHLCS), Helsinki Korp Version urn:nbn:fi:lb-2017022818
c
RES NC LOC ND
YesTNo
a
Korp
Merja SaloMerja Salo2007
helpuhe-2010txt
Helsingin puhekielen pitkittäiskorpus (2010-luvun tekstimuotoinen aineisto)
The Longitudinal Corpus of Finnish Spoken in Helsinki (2010 in text form)
c
c
TextGrid
a
VRT
b
a
Korp
icon-question-circleicon-quote-rightHanna LappalainenHelsingin puhekielen pitkittäiskorpus (2010-luvun tekstimuotoinen aineisto)The Longitudinal Corpus of Finnish Spoken in Helsinki (2010 in text form)urn:nbn:fi:lb-2014073040
c
ACA NC DEP
YesTAlmost
a
Korp
https://www.kielipankki.fi/aineistot/helpuhe/Hanna LappalainenHanna Lappalainen
helpuhe-v2-korp
Helsingin puhekielen pitkittäiskorpuksen (1970, 1990, 2010) Helsinki Korp versio 2
The Longitudinal Corpus of Finnish Spoken in Helsinki (1970s, 1990s and 2010s), Helsinki Korp Version 2
RES
R
c
a
a
a
icon-question-circleicon-quote-rightHanna LappalainenHelsingin puhekielen pitkittäiskorpuksen (1970, 1990, 2010) Helsinki Korp versio 2The Longitudinal Corpus of Finnish Spoken in Helsinki (1970s, 1990s and 2010s), Helsinki Korp Version 2urn:nbn:fi:lb-2016051602http://urn.fi/urn:nbn:fi:lb-2015041303
c
RES NC PRIV DEP
YesT
a
https://www.kielipankki.fi/aineistot/helpuhe/
helpuhe-v2-lat
Helsingin puhekielen pitkittäiskorpuksen (1970, 1990, 2010) Helsinki LAT versio 2
The Longitudinal Corpus of Finnish Spoken in Helsinki (1970s, 1990s and 2010s), Helsinki LAT Version 2
RES
R
c
c
TextGrid
b
ELAN
a
a
Bicon-question-circleicon-quote-rightHanna LappalainenHelsingin puhekielen pitkittäiskorpuksen (1970, 1990, 2010) Helsinki LAT versio 2The Longitudinal Corpus of Finnish Spoken in Helsinki (1970s, 1990s and 2010s), Helsinki LAT Version 2urn:nbn:fi:lb-2016051601http://urn.fi/urn:nbn:fi:lb-2015041303
c
RES NC PRIV DEP
YesTNo
a
https://www.kielipankki.fi/aineistot/helpuhe/
HS
Helsingin Sanomien arkisto -korpus
The Helsingin Sanomat Archive Corpus
c
a
a
VRT
a
Korp
icon-quote-rightJarkko RahkonenHelsingin Sanomien arkisto -korpusThe Helsingin Sanomat Archive Corpusurn:nbn:fi:lb-2014073036
b
ACA
YesT
a
Korp
ingrian-uhlcs-korp
Inkeroisen korpuksen (UHLCS) Helsinki-Korp-versio
Ingrian Corpus (UHLCS), Helsinki Korp Version
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightInkeroisen korpuksen (UHLCS) Helsinki-Korp-versioIngrian Corpus (UHLCS), Helsinki Korp Versionurn:nbn:fi:lb-2017022819
c
RES NC LOC ND
YesTNo
a
Korp
Manja LehtoManja Lehto2007
Inkerin murteet
Inkerin murteiden korpus
The Corpus of Ingrian Finnish
a
a
WORD-DOC, MP3, WAV
a
VRT, ELAN
a
icon-quote-rightMarjatta Palanderwww, muutaInkerin murteiden korpusThe Corpus of Ingrian Finnishurn:nbn:fi:lb-2014073032NoP
a
www, muuta
iweb-ecorg-src
The Intelligent Web Corpus (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali
The Intelligent Web Corpus (Mark Davies, english-corpora.org) - Kielipankki version, source
a
Bicon-quote-rightFIN-CLARINThe Intelligent Web Corpus (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaaliThe Intelligent Web Corpus (Mark Davies, english-corpora.org) - Kielipankki version, sourceurn:nbn:fi:lb-2022112306RES-fiT
a
Mark DaviesMark Davies20182022
kikosa-haa
Oulun yliopiston Kikosa-kokoelma: Ryhmähaastattelut
University of Oulu Kikosa Collection: Group interviews
a
c
WAV, EAF, TXT
c
WAV, EAF, TXT
c
a
icon-quote-rightMaria FrickOulun yliopiston Kikosa-kokoelma: RyhmähaastattelutUniversity of Oulu Kikosa Collection: Group interviewsurn:nbn:fi:lb-2022050221
a
RES NC PRIV NORED DEP OTHER
NoPYes
a
Oulun yliopistoUniversity of Oulu
kikosa-kok
Oulun yliopiston Kikosa-kokoelma:Opiskelijakokoukset
University of Oulu Kikosa Collection: Student meetings
a
c
WAV, EAF, TXT
c
WAV, EAF, TXT
c
a
icon-quote-rightMaria FrickOulun yliopiston Kikosa-kokoelma:OpiskelijakokouksetUniversity of Oulu Kikosa Collection: Student meetingsurn:nbn:fi:lb-2022050222
a
RES NC PRIV NORED DEP OTHER
NoPYes
a
Oulun yliopisto; Salla NiemetmaaUniversity of Oulu; Salla Niemetmaa
Kiltinänsaame
Kirjoitetun kiltinänsaamen korpus
The Corpus of Written Kildin Saami
PUB
P
a
a
a
VRT
b
Korp
icon-quote-rightMikael RiesslerKirjoitetun kiltinänsaamen korpus The Corpus of Written Kildin Saamiurn:nbn:fi:lb-2015102001http://creativecommons.org/licenses/by/4.0/
b
PUB CC BY
NoT
b
Korp
Kiltinänsaame (UHLCS)
Kiltinänsaamen korpus (UHLCS)
Kildin Saami Corpus (UHLCS)
c
c
PDF
b
PDF
a
a
icon-quote-rightPirkko SuihkonenKiltinänsaamen korpus (UHLCS)Kildin Saami Corpus (UHLCS)urn:nbn:fi:lb-2016012201
b
ACA NC
YesTNo
a
klk-fi-v2-korp
Kansalliskirjaston sanoma- ja aikakauslehtikokoelman suomenkielinen osakorpus versio 2, Korp
The Finnish Sub-corpus of the Newspaper and Periodical Corpus of the National Library of Finland version 2, Korp
a
Korp
icon-question-circleicon-quote-rightFIN-CLARINKansalliskirjaston sanoma- ja aikakauslehtikokoelman suomenkielinen osakorpus versio 2, KorpThe Finnish Sub-corpus of the Newspaper and Periodical Corpus of the National Library of Finland version 2, Korpurn:nbn:fi:lb-202009152PUB CC BYT
a
Korp
http://urn.fi/urn:nbn:fi:lb-2021092404{Kansalliskirjasto}{National Library of Finland}2023
komi-ikdp
Puhutun komin korpus: IKDP
Spoken Komi Corpus: IKDP
a
b
MP4, WAV, ELAN
a
MP4, WAV, ELAN
a
a
icon-quote-rightNiko PartanenPuhutun komin korpus: IKDPSpoken Komi Corpus: IKDPurn:nbn:fi:lb-2019121603
a
RES PRIV
NoPNo
a
Rogier Blokland; Michael Riessler; Niko PartanenRogier Blokland; Michael Riessler; Niko Partanen
komi-uhlcs-korp
Komisyrjäänin korpuksen (UHLCS) Helsinki-Korp-versio
Komi Zyrian Corpus (UHLCS), Helsinki Korp Version
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightKomisyrjäänin korpuksen (UHLCS) Helsinki-Korp-versioKomi Zyrian Corpus (UHLCS), Helsinki Korp Versionurn:nbn:fi:lb-2017022817
c
RES NC LOC ND
YesTNo
a
Korp
Paula KokkonenPaula Kokkonen2007
kra-korp
Keskiranskan korpuksen Helsinki-Korp-versio
Jyväskylä Corpus of Middle French, Helsinki Korp Version
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightKeskiranskan korpuksen Helsinki-Korp-versioJyväskylä Corpus of Middle French, Helsinki Korp Versionurn:nbn:fi:lb-2017022806
c
RES NC LOC ND
YesTNo
a
Korp
{Jyväskylän yliopisto, kielten laitos}{University of Jyväskylä, Department of Languages}1999
latin-uhlcs-korp
Latinan korpuksen (UHLCS) Helsinki-Korp-versio
Latin Corpus (UHLCS), Helsinki Korp Version
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightLatinan korpuksen (UHLCS) Helsinki-Korp-versioLatin Corpus (UHLCS), Helsinki Korp Versionurn:nbn:fi:lb-2017022815
c
RES NC LOC ND
YesTNo
a
Korp
Martti NymanMartti Nyman2007
long-second
Long Second -korpus: Suomen kielen kehittyminen alakoulun valmistavalla luokalla
The Long Second Corpus: LONGitudinal Classroom Data about Children’s Development in Finnish as a SECOND Language
b
c
ELAN, MP4
a
VRT, ELAN
a
a
Download, Korp
icon-quote-rightMaria AhlholmLong Second -korpus: Suomen kielen kehittyminen alakoulun valmistavalla luokallaThe Long Second Corpus: LONGitudinal Classroom Data about Children’s Development in Finnish as a SECOND Languageurn:nbn:fi:lb-2015031801
b
RES NC PRIV *Sensitive
AlmostPNo
a
Download, Korp
Maria AhlholmMaria Ahlholm
Lönnrot
Elias Lönnrotin kirjeenvaihto
Elias Lönnrot Letters Online
PUB
P
c
a
XML
a
VRT
a
Korp
icon-quote-rightKirsi KeravuoriwwwElias Lönnrotin kirjeenvaihtoElias Lönnrot Letters Onlineurn:nbn:fi:lb-2017082201https://creativecommons.org/licenses/by-sa/4.0/legalcode
c
PUB CC BY SA
YesT
a
Korp
www
lude-uhlcs-korp
Lyydin korpuksen (UHLCS) Helsinki-Korp-versio
Lude (Ludian) Corpus (UHLCS), Helsinki Korp Version
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightLyydin korpuksen (UHLCS) Helsinki-Korp-versioLude (Ludian) Corpus (UHLCS), Helsinki Korp Versionurn:nbn:fi:lb-2017022813
c
RES NC LOC ND
YesTNo
a
Korp
Miikul PahomovMiikul Pahomov2007
medievalturku
Turun keskiaikaisten asiakirjojen maamerkkien korpus, lähdeaineisto
Corpus of landscapes in medieval documents from Turku, source
PUB
P
a
b
XML
a
XML, VRT, TXT
a
a
Bicon-quote-rightHanna-Mari KupariTurun keskiaikaisten asiakirjojen maamerkkien korpus, lähdeaineistoCorpus of landscapes in medieval documents from Turku, sourceurn:nbn:fi:lb-2023032021http://urn.fi/urn:nbn:fi:lb-2023032023
b
PUB CC BY
NoTNohttp://urn.fi/urn:nbn:fi:lb-2023032022
a
Hanna-Mari Kupari; Marko LambergHanna-Mari Kupari; Marko Lamberghttps://github.com/HannaKoo/landscapes
mepu-src
Puhutun meänkielen korpus, lähdeaineisto
Corpus of Spoken Meänkieli, source
RES
R
a
b
WAV, TXT
b
WAV, TXT
a
a
Bicon-quote-rightNiina KunnasPuhutun meänkielen korpus, lähdeaineistoCorpus of Spoken Meänkieli, sourceurn:nbn:fi:lb-2022112921http://urn.fi/urn:nbn:fi:lb-2022112923
a
RES NC PRIV NORED DEP OTHER
NoPNohttp://urn.fi/urn:nbn:fi:lb-2022112922
a
Niina Kunnas; Veikka Ritola; Jenna VikmanNiina Kunnas; Veikka Ritola; Jenna Vikman
mlcca
MLCCA, Monikielinen sopimustekstien korpus
MLCCA, Multilingual Corpus of Contracts and Agreements
RES
R
a
c
XML, VRT
c
XML, VRT
a
Aicon-quote-rightMikhail MikhailovMLCCA, Monikielinen sopimustekstien korpusMLCCA, Multilingual Corpus of Contracts and Agreementsurn:nbn:fi:lb-2022101821http://urn.fi/urn:nbn:fi:lb-2022101823
b
PUB CC BY / RES NC DEP
NoThttp://urn.fi/urn:nbn:fi:lb-2022101822
a
Mikhail Mikhailov; Julia SoumaMikhail Mikhailov; Julia Souma2020
movie-ecorg-src
The Movie Corpus (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali
The Movie Corpus (Mark Davies, english-corpora.org) - Kielipankki version, source
a
Bicon-quote-rightFIN-CLARINThe Movie Corpus (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaaliThe Movie Corpus (Mark Davies, english-corpora.org) - Kielipankki version, sourceurn:nbn:fi:lb-2022112301RES-fiT
a
Mark DaviesMark Davies20192022
mutable-src
Kuvailutulkkaus sokeiden ja näkevien yhteistyönä
Multimodal Translation with the Blind
a
c
MP4, EAF, TXT
b
MP4, EAF, TXT
a
a
Bicon-quote-rightMaija Hirvonenhttps://projects.tuni.fi/mutable/the-mutable-corpus/Kuvailutulkkaus sokeiden ja näkevien yhteistyönäMultimodal Translation with the Blindurn:nbn:fi:lb-2021042021
b
RES NC PRIV NORED DEP OTHER
NoPNo
a
Maija HirvonenMaija Hirvonenhttps://projects.tuni.fi/mutable/the-mutable-corpus/
nenets-uhlcs-korp
Nenetsin korpuksen (UHLCS) Helsinki-Korp-versio
Nenets Corpus (Tundra Nenets) (UHLCS), Helsinki Korp Version
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightNenetsin korpuksen (UHLCS) Helsinki-Korp-versioNenets Corpus (Tundra Nenets) (UHLCS), Helsinki Korp Versionurn:nbn:fi:lb-2017022812
c
RES NC LOC ND
YesTNo
a
Korp
Tapani SalminenTapani Salminen2007
Nganasan
Nganasanin kielen puhekorpus
Nganasan Speech Corpus
c
a
ELAN
a
VRT, ELAN
a
icon-quote-rightLarisa LeisiöNganasanin kielen puhekorpus Nganasan Speech Corpusurn:nbn:fi:lb-2014100302
c
ACA NC DEP
YesP
a
nmk-korp
Nimimaiseman muutos -korpuksen Helsinki Korp -versio
Changes in Place Names Corpus, Helsinki Korp Version
ACA
A
c
a
a
VRT
a
Korp
icon-quote-rightElisa StenvallNimimaiseman muutos -korpuksen Helsinki Korp -versioChanges in Place Names Corpus, Helsinki Korp Versionurn:nbn:fi:lb-2016031702https://www.kielipankki.fi/lic/nmk/
c
ACA NC
YesT
a
Korp
nmk-lat
Nimimaiseman muutos -korpuksen Helsinki LAT -versio
Changes in Place Names Corpus, Helsinki LAT Version
ACA
A
c
a
a
ELAN
a
icon-quote-rightElisa StenvallNimimaiseman muutos -korpuksen Helsinki LAT -versioChanges in Place Names Corpus, Helsinki LAT Versionurn:nbn:fi:lb-2016031702https://www.kielipankki.fi/lic/nmk/
b
ACA NC
YesP
a
NorDiga
Nordican digitaalinen arkisto
The Nordica Digital Archive
a
a
a
VRT
a
a
Korp
icon-quote-rightJan LindströmwwwNordican digitaalinen arkistoThe Nordica Digital Archiveurn:nbn:fi:lb-2016032401NoTNo
a
Korp
www
north-saami-literature-uhlcs-korp
Pohjoissaamen korpus (kirjallisuutta) (UHLCS), Helsinki-Korp-versio
North Saami Corpus (Literature) (UHLCS), Helsinki Korp Version
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightPohjoissaamen korpus (kirjallisuutta) (UHLCS), Helsinki-Korp-versioNorth Saami Corpus (Literature) (UHLCS), Helsinki Korp Versionurn:nbn:fi:lb-2017022810
c
RES NC LOC ND
YesTNo
a
Korp
Kerttu VuolabKerttu Vuolab2007
north-saami-report-uhlcs-korp
Pohjoissaamen korpuksen (Sámikultuvradoaibmagotti smiehttamush) (UHLCS) Helsinki-Korp-versio
North Saami Corpus (Sámikultuvradoaibmagotti smiehttamush) (UHLCS), Helsinki Korp Version Corpus
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightPohjoissaamen korpuksen (Sámikultuvradoaibmagotti smiehttamush) (UHLCS) Helsinki-Korp-versioNorth Saami Corpus (Sámikultuvradoaibmagotti smiehttamush) (UHLCS), Helsinki Korp Version Corpusurn:nbn:fi:lb-2017022811
c
RES NC LOC ND
YesTNo
a
Korp
Irja Seurujärvi-KariIrja Seurujärvi-Kari2007
now-ecorg-2021-05-src
News on the Web (Mark Davies, english-corpora.org) - Kielipankin versio 2021-05, lähdemateriaali
News on the Web (Mark Davies, english-corpora.org) - Kielipankki version 2021-05, source
a
Bicon-quote-rightFIN-CLARINNews on the Web (Mark Davies, english-corpora.org) - Kielipankin versio 2021-05, lähdemateriaaliNews on the Web (Mark Davies, english-corpora.org) - Kielipankki version 2021-05, sourceurn:nbn:fi:lb-2022112401RES-fiT
a
Mark DaviesMark Davies20162022
nzadi
Nzadin korpus
Nzadi Corpus
a
a
WAV, PDF, TXT
a
WAV, PDF, TXT
a
a
Download, Korp
icon-quote-rightThera Marie CraneNzadin korpusNzadi Corpus
a
NoPNo
a
Download, Korp
Thera Marie Crane; Larry Hyman; Simon TukumuThera Marie Crane; Larry Hyman; Simon Tukumu
ona
Oulun nauhoitearkisto
The Audio Recordings Archive of Oulu (ONA)
RES
R
c
b
a
ELAN
a
icon-quote-rightNiina KunnasOulun nauhoitearkistoThe Audio Recordings Archive of Oulu (ONA)urn:nbn:fi:lb-2016110701http://urn.fi/urn:nbn:fi:lb-2016121616RES NC PRIV DEPYesP
a
{Oulun yliopisto, suomen kielen oppiaine}{University of Oulu, Department of Finnish Language}
Opus ECB
Opus EKP -korpus
Opus ECB Corpus
PUB
P
a
a
c
a
icon-quote-rightJörg TiedemannOpus EKP -korpusOpus ECB Corpusurn:nbn:fi:lb-2016012801 http://creativecommons.org/licenses/by-nc/4.0/
c
PUB CC BY NC
TYes
a
Opus EU
Opus EU -korpus
Opus EU Corpus
PUB
P
a
a
c
a
icon-quote-rightJörg TiedemannOpus EU -korpusOpus EU Corpusurn:nbn:fi:lb-2016012802http://creativecommons.org/licenses/by/4.0/
c
PUB CC BY
TYes
a
Opus Localization
Opus lokalisointi -korpus
Opus Localization Corpus
a
a
c
a
icon-quote-rightJörg TiedemannOpus lokalisointi -korpusOpus Localization Corpusurn:nbn:fi:lb-2016012803https://opensource.org/licenses/MIT
c
MIT
TYes
a
Opus Subtitles
Opus tekstitys -korpus
Opus Subtitles Corpus
PUB
P
a
a
c
a
icon-quote-rightJörg TiedemannOpus tekstitys -korpusOpus Subtitles Corpusurn:nbn:fi:lb-2016012804 http://creativecommons.org/licenses/by-nc/4.0/
c
PUB CC BY NC
TYes
a
oulu-korp
Oulun korpuksen Helsinki-Korp-versio
Oulu Corpus, Helsinki Korp Version
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightOulun korpuksen Helsinki-Korp-versioOulu Corpus, Helsinki Korp Versionurn:nbn:fi:lb-2017022805
c
RES NC LOC ND
YesTNo
a
Korp
{Oulun yliopisto, suomen kielen oppiaine}{University of Oulu, Department of Finnish Language}2013
parole-fi-korp
Suomen kielen Parole-korpuksen Helsinki-Korp-versio
The Finnish Parole Corpus, Helsinki Korp Version
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightSuomen kielen Parole-korpuksen Helsinki-Korp-versioThe Finnish Parole Corpus, Helsinki Korp Versionurn:nbn:fi:lb-2017022804
c
RES NC LOC ND
YesTNo
a
Korp
{Helsingin yliopisto}{University of Helsinki}1998
PERSO
PERSO Databases for Finnish Speech Synthesis
PERSO Databases for Finnish Speech Synthesis
c
c
TXT, WAV
a
ELAN
b
a
icon-quote-rightMartti Vainio, Heini KallioPERSO Databases for Finnish Speech SynthesisPERSO Databases for Finnish Speech Synthesisurn:nbn:fi:lb-2014073053
c
ACA NC
YesPAlmost
a
ProoF
ProoF - Maahanmuuttajien suomen kielen ääntäminen
ProoF - Pronunciation of Finnish by Immigrants in Finland
a
a
wav + Praat
a
ELAN
a
icon-quote-rightMietta LennesProoF - Maahanmuuttajien suomen kielen ääntäminenProoF - Pronunciation of Finnish by Immigrants in Finland urn:nbn:fi:lb-20140730130
b
RES
NoP
a
Prosodiakorpus
Suomen kielen prosodian variaation korpus
Corpus of Prosodic Variation of Finnish
a
a
a
ELAN
a
icon-quote-rightTommi Kurki, Tommi NieminenSuomen kielen prosodian variaation korpusCorpus of Prosodic Variation of Finnishurn:nbn:fi:lb-2014090803
b
ACA
NoP
a
puhelahjat-annotated
Lahjoita puhetta: Annotoitu aineisto
Donate Speech: Annotated dataset
RES
R
c
c
WAV, FLAC, JSON
c
FLAC, CSV, TXT, TextGrid, ELAN
c
Aicon-question-circleicon-quote-rightFIN-CLARINhttps://www.kielipankki.fi/lahjoita-puhetta/Lahjoita puhetta: Annotoitu aineistoDonate Speech: Annotated dataseturn:nbn:fi:lb-2022060128http://urn.fi/urn:nbn:fi:lb-2022020223
c
RES NC PRIV DEP OTHER
YesP
c
https://www.kielipankki.fi/aineistot/puhelahjat/{Helsingin yliopisto}{University of Helsinki}20232023https://www.kielipankki.fi/lahjoita-puhetta/
puhelahjat-dev
Lahjoita puhetta, Valikoitu aineisto: Kehitysdata (10h)
Donate Speech: Selected dataset, Development data (10h)
RES
R
c
c
WAV, FLAC, JSON
c
FLAC, CSV, TXT, TextGrid, ELAN
b
Aicon-question-circleicon-quote-rightAnssi Moisiohttps://www.kielipankki.fi/lahjoita-puhetta/Lahjoita puhetta, Valikoitu aineisto: Kehitysdata (10h)Donate Speech: Selected dataset, Development data (10h)urn:nbn:fi:lb-2022060121http://urn.fi/urn:nbn:fi:lb-2022020223
c
RES NC PRIV DEP OTHER
YesP
b
https://www.kielipankki.fi/aineistot/puhelahjat/{Helsingin yliopisto}{University of Helsinki}20222022https://www.kielipankki.fi/lahjoita-puhetta/
puhelahjat-dev
Lahjoita puhetta, Valikoitu aineisto: Kehitysdata (10h) (yrityskäyttöön)
Donate Speech, Selected dataset: Development data (10h) (commercial use)
c
c
WAV, FLAC, JSON
c
FLAC, CSV, TXT, TextGrid, ELAN
b
Aicon-question-circleicon-quote-rightAnssi Moisiohttps://www.kielipankki.fi/lahjoita-puhetta/Lahjoita puhetta, Valikoitu aineisto: Kehitysdata (10h) (yrityskäyttöön)Donate Speech, Selected dataset: Development data (10h) (commercial use)urn:nbn:fi:lb-2022060121http://urn.fi/urn:nbn:fi:lb-2022060130
c
Commercial license
YesP
b
https://www.kielipankki.fi/aineistot/puhelahjat-commercial/{Helsingin yliopisto}{University of Helsinki}20232023https://www.kielipankki.fi/lahjoita-puhetta/
puhelahjat-korp
Lahjoita puhetta -aineisto, Korp
Donate Speech Corpus, Korp
RES
R
a
c
TXT, TextGrid
a
VRT
a
a
Korp
Aicon-question-circleicon-quote-rightFIN-CLARINLahjoita puhetta -aineisto, KorpDonate Speech Corpus, Korpurn:nbn:fi:lb-2022112121http://urn.fi/urn:nbn:fi:lb-2022020223
c
RES NC PRIV DEP OTHER
NoPNohttp://urn.fi/urn:nbn:fi:lb-2022112121
a
Korp
http://urn.fi/urn:nbn:fi:lb-2022102122{Helsingin yliopisto}{University of Helsinki}2022
puhelahjat-selected
Lahjoita puhetta: Valikoitu aineisto
Donate Speech: Selected dataset
RES
R
c
c
WAV, FLAC, JSON
c
FLAC, CSV, TXT, TextGrid, ELAN
c
Aicon-question-circleicon-quote-rightFIN-CLARINhttps://www.kielipankki.fi/lahjoita-puhetta/Lahjoita puhetta: Valikoitu aineistoDonate Speech: Selected dataseturn:nbn:fi:lb-2022060127http://urn.fi/urn:nbn:fi:lb-2022020223
c
RES NC PRIV DEP OTHER
YesP
c
https://www.kielipankki.fi/aineistot/puhelahjat/{Helsingin yliopisto}{University of Helsinki}20232023https://www.kielipankki.fi/lahjoita-puhetta/
puhelahjat-test
Lahjoita puhetta, Valikoitu aineisto: Testidata (10h)
Donate Speech: Selected dataset, Test data (10h)
RES
R
c
c
WAV, FLAC, JSON
c
FLAC, CSV, TXT, TextGrid, ELAN
b
Aicon-question-circleicon-quote-rightAnssi Moisiohttps://www.kielipankki.fi/lahjoita-puhetta/Lahjoita puhetta, Valikoitu aineisto: Testidata (10h)Donate Speech: Selected dataset, Test data (10h)urn:nbn:fi:lb-2022060122http://urn.fi/urn:nbn:fi:lb-2022020223
c
RES NC PRIV DEP OTHER
YesP
b
https://www.kielipankki.fi/aineistot/puhelahjat/{Helsingin yliopisto}{University of Helsinki}20222022https://www.kielipankki.fi/lahjoita-puhetta/
puhelahjat-test
Lahjoita puhetta, Valikoitu aineisto: Testidata (10h) (yrityskäyttöön)
Donate Speech, Selected dataset: Test data (10h) (commercial use)
c
c
WAV, FLAC, JSON
c
FLAC, CSV, TXT, TextGrid, ELAN
b
Aicon-question-circleicon-quote-rightAnssi Moisiohttps://www.kielipankki.fi/lahjoita-puhetta/Lahjoita puhetta, Valikoitu aineisto: Testidata (10h) (yrityskäyttöön)Donate Speech, Selected dataset: Test data (10h) (commercial use)urn:nbn:fi:lb-2022060122http://urn.fi/urn:nbn:fi:lb-2022060130
c
Commercial license
YesP
b
https://www.kielipankki.fi/aineistot/puhelahjat-commercial/{Helsingin yliopisto}{University of Helsinki}20232023https://www.kielipankki.fi/lahjoita-puhetta/
puhelahjat-test-mtr
Lahjoita puhetta, Valikoitu aineisto: Usean litteroijan testidata (1h)
Donate Speech: Selected dataset, Multi-transcriber test data (1h)
RES
R
c
c
WAV, FLAC, JSON
c
FLAC, CSV, TXT, TextGrid, ELAN
b
Aicon-question-circleicon-quote-rightAnssi Moisiohttps://www.kielipankki.fi/lahjoita-puhetta/Lahjoita puhetta, Valikoitu aineisto: Usean litteroijan testidata (1h)Donate Speech: Selected dataset, Multi-transcriber test data (1h)urn:nbn:fi:lb-2022060124http://urn.fi/urn:nbn:fi:lb-2022020223
c
RES NC PRIV DEP OTHER
YesP
b
https://www.kielipankki.fi/aineistot/puhelahjat/{Helsingin yliopisto}{University of Helsinki}20222022https://www.kielipankki.fi/lahjoita-puhetta/
puhelahjat-test-mtr
Lahjoita puhetta, Valikoitu aineisto: Usean litteroijan testidata (1h) (yrityskäyttöön)
Donate Speech, Selected dataset: Multi-transcriber test data (1h) (commercial use)
c
c
WAV, FLAC, JSON
c
FLAC, CSV, TXT, TextGrid, ELAN
b
Aicon-question-circleicon-quote-rightAnssi Moisiohttps://www.kielipankki.fi/lahjoita-puhetta/Lahjoita puhetta, Valikoitu aineisto: Usean litteroijan testidata (1h) (yrityskäyttöön)Donate Speech, Selected dataset: Multi-transcriber test data (1h) (commercial use)urn:nbn:fi:lb-2022060124http://urn.fi/urn:nbn:fi:lb-2022060130
c
Commercial license
YesP
b
https://www.kielipankki.fi/aineistot/puhelahjat-commercial/{Helsingin yliopisto}{University of Helsinki}20232023https://www.kielipankki.fi/lahjoita-puhetta/
puhelahjat-test-mtrs
Lahjoita puhetta, Valikoitu aineisto: Testidata useaan kertaan litteroiduilta puhujilta (10h)
Donate Speech: Selected dataset, Test data from multi-transcriber speakers (10h)
RES
R
c
c
WAV, FLAC, JSON
c
FLAC, CSV, TXT, TextGrid, ELAN
b
Aicon-question-circleicon-quote-rightAnssi Moisiohttps://www.kielipankki.fi/lahjoita-puhetta/Lahjoita puhetta, Valikoitu aineisto: Testidata useaan kertaan litteroiduilta puhujilta (10h)Donate Speech: Selected dataset, Test data from multi-transcriber speakers (10h)urn:nbn:fi:lb-2022060125http://urn.fi/urn:nbn:fi:lb-2022020223
c
RES NC PRIV DEP OTHER
YesP
b
https://www.kielipankki.fi/aineistot/puhelahjat/{Helsingin yliopisto}{University of Helsinki}20222022https://www.kielipankki.fi/lahjoita-puhetta/
puhelahjat-test-mtrs
Lahjoita puhetta, Valikoitu aineisto: Testidata useaan kertaan litteroiduilta puhujilta (10h) (yrityskäyttöön)
Donate Speech, Selected dataset: Test data from multi-transcriber speakers (10h) (commercial use)
c
c
WAV, FLAC, JSON
c
FLAC, CSV, TXT, TextGrid, ELAN
b
Aicon-question-circleicon-quote-rightAnssi Moisiohttps://www.kielipankki.fi/lahjoita-puhetta/Lahjoita puhetta, Valikoitu aineisto: Testidata useaan kertaan litteroiduilta puhujilta (10h) (yrityskäyttöön)Donate Speech, Selected dataset: Test data from multi-transcriber speakers (10h) (commercial use)urn:nbn:fi:lb-2022060125http://urn.fi/urn:nbn:fi:lb-2022060130
c
Commercial license
YesP
b
https://www.kielipankki.fi/aineistot/puhelahjat-commercial/{Helsingin yliopisto}{University of Helsinki}20232023https://www.kielipankki.fi/lahjoita-puhetta/
puhelahjat-train
Lahjoita puhetta, Valikoitu aineisto: Opetusdata (100h)
Donate Speech: Selected dataset, Training data (100h)
RES
R
c
c
WAV, FLAC, JSON
c
FLAC, CSV, TXT, TextGrid, ELAN
b
Aicon-question-circleicon-quote-rightAnssi Moisiohttps://www.kielipankki.fi/lahjoita-puhetta/Lahjoita puhetta, Valikoitu aineisto: Opetusdata (100h)Donate Speech: Selected dataset, Training data (100h)urn:nbn:fi:lb-2022060123http://urn.fi/urn:nbn:fi:lb-2022020223
c
RES NC PRIV DEP OTHER
YesP
b
https://www.kielipankki.fi/aineistot/puhelahjat/{Helsingin yliopisto}{University of Helsinki}20222022https://www.kielipankki.fi/lahjoita-puhetta/
puhelahjat-train
Lahjoita puhetta, Valikoitu aineisto: Opetusdata (100h) (yrityskäyttöön)
Donate Speech, Selected dataset: Training data (100h) (commercial use)
c
c
WAV, FLAC, JSON
c
FLAC, CSV, TXT, TextGrid, ELAN
b
Aicon-question-circleicon-quote-rightAnssi Moisiohttps://www.kielipankki.fi/lahjoita-puhetta/Lahjoita puhetta, Valikoitu aineisto: Opetusdata (100h) (yrityskäyttöön)Donate Speech, Selected dataset: Training data (100h) (commercial use)urn:nbn:fi:lb-2022060123http://urn.fi/urn:nbn:fi:lb-2022060130
c
Commercial license
YesP
b
https://www.kielipankki.fi/aineistot/puhelahjat-commercial/{Helsingin yliopisto}{University of Helsinki}20232023https://www.kielipankki.fi/lahjoita-puhetta/
quantlang-uhlcs-korp
Kvantifiointi suomessa ja keskisen Volgan ja Kaman alueella puhuttavissa kielissä (UHLCS), Helsinki-Korp-versio
Quantifiers and Quantification in Finnish and Languages Spoken in the Central Volga–Kama Region (UHLCS), Helsinki Korp Version
c
c
PDF
a
VRT
a
a
Korp
icon-quote-rightKvantifiointi suomessa ja keskisen Volgan ja Kaman alueella puhuttavissa kielissä (UHLCS), Helsinki-Korp-versioQuantifiers and Quantification in Finnish and Languages Spoken in the Central Volga–Kama Region (UHLCS), Helsinki Korp Versionurn:nbn:fi:lb-2017030104
c
RES NC ND
YesTNo
a
Korp
Pirkko SuihkonenPirkko Suihkonen2016
Saamen kielen korpus
Puhutun saamen kielen korpus (Giellagas)
Giellagas Corpus of Spoken Saami Languages
c
c
a
ELAN
b
icon-quote-rightMarko JoustePuhutun saamen kielen korpus (Giellagas)Giellagas Corpus of Spoken Saami Languagesurn:nbn:fi:lb-2015060801
c
RES INF NC PRIV DEP
YesP
b
sapu
Satakuntalaisuus puheessa -korpus
The Corpus of Sociolinguistic Variation in the Province of Satakunta
RES
R
a
b
WAV, TextGrid, TXT
b
WAV, TextGrid, TXT
a
a
icon-quote-rightTommi KurkiSatakuntalaisuus puheessa -korpusThe Corpus of Sociolinguistic Variation in the Province of Satakuntaurn:nbn:fi:lb-2022092121http://urn.fi/urn:nbn:fi:lb-2022092122
a
RES NC PRIV NORED DEP OTHER
NoPNo
a
Tommi Kurki; Kirsti Siitonen; Nobufumi InabaTommi Kurki; Kirsti Siitonen; Nobufumi Inaba
sfnet-korp
SFNET-keskusteluryhmäkorpuksen Helsinki-Korp-versio
SFNET Corpus, Helsinki Korp Version
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightSFNET-keskusteluryhmäkorpuksen Helsinki-Korp-versioSFNET Corpus, Helsinki Korp Versionurn:nbn:fi:lb-2017022803
c
ACA NC
YesTNo
a
Korp
Tuuli Tuominen; Panu Kalliokoski; Antti Arppe; {CSC - Tieteen tietotekniikan keskus}Tuuli Tuominen; Panu Kalliokoski; Antti Arppe; {CSC - IT Center for Science}2003
SignWiki
Viittomakielten SignWiki-hanke
The SignWiki Project of the Sign Languages in Finland
a
a
a
ELAN
a
icon-quote-rightLeena SavolainenwwwViittomakielten SignWiki-hankeThe SignWiki Project of the Sign Languages in FinlandNoP
a
www
skk-vrt
Suomalaisen kirjallisuuden klassikoita, VRT
Classics of Finnish Literature, VRT
PUB
P
c
VRT
icon-question-circleicon-quote-rightPetri LauermaSuomalaisen kirjallisuuden klassikoita, VRTClassics of Finnish Literature, VRTurn:nbn:fi:lb-2017121321http://ec.europa.eu/idabc/eupl.htmlPUB EUPL v1.1YesT
http://urn.fi/urn:nbn:fi:lb-2021050703{Kotimaisten kielten keskus}{Institute for the Languages of Finland}
soap-ecorg-src
Corpus of American Soap Operas (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali
Corpus of American Soap Operas (Mark Davies, english-corpora.org) - Kielipankki version, source
a
Bicon-quote-rightFIN-CLARINCorpus of American Soap Operas (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaaliCorpus of American Soap Operas (Mark Davies, english-corpora.org) - Kielipankki version, sourceurn:nbn:fi:lb-2022112406RES-fiT
a
Mark DaviesMark Davies20112022
stat-fi-en
Tilastokeskuksen suomi-englanti-käännösmuisti
Statistics Finland Translation Memory Finnish-English
c
TMX
b
TMX
c
a
icon-quote-rightTilastokeskuksen suomi-englanti-käännösmuistiStatistics Finland Translation Memory Finnish-Englishurn:nbn:fi:lb-2017090405TYes
a
{Tilastokeskus}{Statistics Finland}
stat-fi-sv
Tilastokeskuksen suomi-ruotsi-käännösmuisti
Statistics Finland's Finnish to Swedish Translation Memory
c
TMX
b
TMX
c
a
icon-quote-rightTilastokeskuksen suomi-ruotsi-käännösmuistiStatistics Finland's Finnish to Swedish Translation Memoryurn:nbn:fi:lb-2017090404TYes
a
{Tilastokeskus}{Statistics Finland}
sus-fieldwork
Suomalais-Ugrilaisen Seuran kenttätyökorpus
The Finno-Ugrian Society Fieldwork Corpus
PUB
P
c
a
a
VRT
a
Korp
icon-quote-rightJack RueterSuomalais-Ugrilaisen Seuran kenttätyökorpusThe Finno-Ugrian Society Fieldwork Corpusurn:nbn:fi:lb-2016092001http://creativecommons.org/licenses/by-nc/4.0/
c
PUB CC BY NC
YesT
a
Korp
Suvi
Suvi-verkkosanakirja
Suvi Finnish Sign Language Online Dictionary
a
a
a
ELAN
a
icon-quote-rightLeena SavolainenwwwSuvi-verkkosanakirjaSuvi Finnish Sign Language Online Dictionary urn:nbn:fi:lb-2014073039NoP
a
www
TAITO
TAITO-hankkeen kirjalliset ja suulliset aineistot
Written and Oral Data of the TAITO-project
a
a
TXT
a
ELAN
a
icon-quote-rightMarjo VesalainenwwwTAITO-hankkeen kirjalliset ja suulliset aineistotWritten and Oral Data of the TAITO-projecturn:nbn:fi:lb-2014073035
b
RES
NoP
a
www
tampuhe
Tampereen puhekielen pitkittäisaineisto
Longitudinal data of Tampere spoken language
RES
R
a
b
WAV, TextGrid
b
WAV, TextGrid
a
a
icon-quote-rightLiisa MustanojaTampereen puhekielen pitkittäisaineistoLongitudinal data of Tampere spoken languageurn:nbn:fi:lb-2022090821http://urn.fi/urn:nbn:fi:lb-2022090822
b
RES NC PRIV NORED DEP OTHER
NoPNo
a
Liisa MustanojaLiisa Mustanoja
tboneslim-src
T-Bone Slim -korpus, lähdemateriaali
T-Bone Slim Corpus, source
PUB
P
a
b
PDF, JPG, TIFF
a
PDF, TXT
a
a
Aicon-quote-rightKirsti Salmi-Niklanderhttps://blogs.helsinki.fi/tboneslimT-Bone Slim -korpus, lähdemateriaaliT-Bone Slim Corpus, sourceurn:nbn:fi:lb-2022111621http://urn.fi/urn:nbn:fi:lb-2022111623
b
PUB CC BY
NoTNohttp://urn.fi/urn:nbn:fi:lb-2022111622
a
Kirsti Salmi-Niklander; Lotta Leiwo; muitaKirsti Salmi-Niklander; Lotta Leiwo; othershttps://blogs.helsinki.fi/tboneslim
testipiste
Testipisteaineisto
Testipiste Corpus
c
a
VRT
a
Korp
icon-quote-rightJanne LaitinenTestipisteaineistoTestipiste Corpusurn:nbn:fi:lb-2017020701
c
RES NC
YesT
a
Korp
Janne LaitinenJanne Laitinen
Turjansaame
Puhutun ja kirjoitetun turjansaamen korpus
The Corpus of Spoken and Written Ter Saami
PUB
P
a
a
TXT
a
VRT
a
Korp
icon-quote-rightMichael RiesslerPuhutun ja kirjoitetun turjansaamen korpusThe Corpus of Spoken and Written Ter Saamiurn:nbn:fi:lb-2015102002http://creativecommons.org/licenses/by/4.0/
b
PUB CC BY
NoT
a
Korp
tv-ecorg-src
The TV Corpus (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali
The TV Corpus (Mark Davies, english-corpora.org) - Kielipankki version, source
a
Bicon-quote-rightFIN-CLARINThe TV Corpus (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaaliThe TV Corpus (Mark Davies, english-corpora.org) - Kielipankki version, sourceurn:nbn:fi:lb-2022112411RES-fiT
a
Mark DaviesMark Davies20192022
tver-1980
Tverinkarjalan korpus 1957-1971
The Corpus of Tver Karelian 1957-1971
a
c
WAV, EAF, TXT
c
WAV, EAF, TXT
c
a
Bicon-quote-rightMarjatta PalanderTverinkarjalan korpus 1957-1971The Corpus of Tver Karelian 1957-1971urn:nbn:fi:lb-2022053121
b
PUB CC BY
NoPYes
a
Marjatta Palander; Milla Uusitupa; Helka RiionheimoMarjatta Palander; Milla Uusitupa; Helka Riionheimo
tver-2020
Tverinkarjalan korpus 2016-2019
The Corpus of Tver Karelian 2016-2019
a
c
WAV, EAF, TXT
c
WAV, EAF, TXT
c
a
Bicon-quote-rightMarjatta PalanderTverinkarjalan korpus 2016-2019The Corpus of Tver Karelian 2016-2019urn:nbn:fi:lb-2022053122
b
RES NC PRIV DEP OTHER
NoPYes
a
Marjatta Palander; Milla Uusitupa; Helka RiionheimoMarjatta Palander; Milla Uusitupa; Helka Riionheimo
ume-saami-uhlcs-korp
Uumajansaamen korpuksen (UHLCS) Helsinki-Korp-versio
Ume Saami Corpus (UHLCS), Helsinki Korp Version Corpus
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightUumajansaamen korpuksen (UHLCS) Helsinki-Korp-versioUme Saami Corpus (UHLCS), Helsinki Korp Version Corpusurn:nbn:fi:lb-2017022809
c
RES NC LOC ND
YesTNo
a
Korp
Olavi KorhonenOlavi Korhonen2007
uralic-uhlcs-korp
Uralilaisia, turkkilaisia, indo-iranilaisia ja mongolikieliä sekä Siperian ja Kaukasian kieliä (UHLCS), Helsinki-Korp-versio
Uralic, Turkic, Indo-Iranian and Mongol languages; languages of Siberia and Caucasia (UHLCS), Helsinki Korp Version
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightUralilaisia, turkkilaisia, indo-iranilaisia ja mongolikieliä sekä Siperian ja Kaukasian kieliä (UHLCS), Helsinki-Korp-versioUralic, Turkic, Indo-Iranian and Mongol languages; languages of Siberia and Caucasia (UHLCS), Helsinki Korp Versionurn:nbn:fi:lb-2017022808
c
RES NC LOC ND
YesTNo
a
Korp
Pirkko SuihkonenPirkko Suihkonen2007
uzbek-uhlcs-korp
Uzbekki-englanti sanakirjan (UHLCS) Helsinki-Korp-versio
Uzbek-English Dictionary (UHLCS), Helsinki Korp Version
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightUzbekki-englanti sanakirjan (UHLCS) Helsinki-Korp-versioUzbek-English Dictionary (UHLCS), Helsinki Korp Versionurn:nbn:fi:lb-2017022807
c
RES NC LOC ND
YesTNo
a
Korp
Daniel KimmageDaniel Kimmage2007
VVKS
Virtuaalinen vanha kirjasuomi (VVKS) -kokoelman Kielipankin Korp-versio
Virtual Old Literary Finnish (VVKS) - Kielipankki Korp version
PUB
P
c
a
a
VRT
a
a
Korp
icon-quote-rightMari SiiroinenVirtuaalinen vanha kirjasuomi (VVKS) -kokoelman Kielipankin Korp-versioVirtual Old Literary Finnish (VVKS) - Kielipankki Korp versionurn:nbn:fi:lb-2017082101https://creativecommons.org/licenses/by-nc-nd/4.0/legalcode
b
PUB CC BY NC ND
YesTNo
a
Korp
{Helsingin yliopisto, suomen kielen, suomalais-ugrilaisten ja pohjoismaisten kielten ja kirjallisuuksien laitos}{University of Helsinki, The Department of Finnish, Finno-Ugrian and Scandinavian Studies}2016
wikipedia-ecorg-src
The Wikipedia Corpus (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali
The Wikipedia Corpus (Mark Davies, english-corpora.org) - Kielipankki version, source
RES
R
a
Bicon-question-circleicon-quote-rightFIN-CLARINThe Wikipedia Corpus (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaaliThe Wikipedia Corpus (Mark Davies, english-corpora.org) - Kielipankki version, sourceurn:nbn:fi:lb-2023032901http://urn.fi/urn:nbn:fi:lb-2023032903RES-fiT
a
http://urn.fi/urn:nbn:fi:lb-2023032905Mark DaviesMark Davies2023
wikipedia-fi-2017-korp
Suomenkielinen Wikipedia 2017, Korp
Finnish Wikipedia 2017, Korp
PUB
P
c
c
VRT
b
VRT
c
a
Korp
icon-quote-rightTatu HuovilainenSuomenkielinen Wikipedia 2017, KorpFinnish Wikipedia 2017, Korpurn:nbn:fi:lb-2018060401https://creativecommons.org/licenses/by/4.0/legalcode
c
PUB CC BY
YesTYes
a
Korp
Tatu HuovilainenTatu Huovilainen2018
wordlists-uhlcs-korp
Sanaluettelokorpuksen (UHLCS) Helsinki-Korp-versio
Lists of Words Corpus (UHLCS), Helsinki Korp Version
c
c
TXT
a
VRT
a
a
Korp
icon-quote-rightSanaluettelokorpuksen (UHLCS) Helsinki-Korp-versioLists of Words Corpus (UHLCS), Helsinki Korp Versionurn:nbn:fi:lb-2017022814
c
RES NC LOC ND
YesTNo
a
Korp
Pirkko SuihkonenPirkko Suihkonen2007
Yle-subtitle
Ylen ruututekstikorpus
The Finnish Broadcasting Company Corpus of Subtitles
a
a
TXT
a
VRT
a
Korp
icon-quote-rightJukka MäkisaloYlen ruututekstikorpusThe Finnish Broadcasting Company Corpus of Subtitlesurn:nbn:fi:lb-20140730134
b
RES
NoT
a
Korp
ylenews-fi-2019-2021-selko-korp
Ylen suomenkielisen uutisarkiston selkouutiset 2019-2021, Korp
Yle News Archive Easy-to-read Finnish 2019-2021, Korp
ACA
A
a
Korp
Aicon-question-circleicon-quote-rightYlen suomenkielisen uutisarkiston selkouutiset 2019-2021, KorpYle News Archive Easy-to-read Finnish 2019-2021, Korpurn:nbn:fi:lb-2022080401http://urn.fi/urn:nbn:fi:lb-2019121001ACA NCT
a
Korp
http://urn.fi/urn:nbn:fi:lb-2021020901{Yleisradio}{Yleisradio}2022
ylenews-fi-2019-2021-selko-s-korp
Ylen suomenkielisen uutisarkiston selkouutiset 2019-2021, sekoitettu, Korp
Yle News Archive Easy-to-read Finnish 2019-2021, scrambled, Korp
PUB
P
a
Korp
Aicon-question-circleicon-quote-rightYlen suomenkielisen uutisarkiston selkouutiset 2019-2021, sekoitettu, KorpYle News Archive Easy-to-read Finnish 2019-2021, scrambled, Korpurn:nbn:fi:lb-2022080403http://creativecommons.org/licenses/by/4.0/PUB CC BYT
a
Korp
http://urn.fi/urn:nbn:fi:lb-2021020901{Yleisradio}{Yleisradio}2022