
| IDA | Aineiston nimi | Name of corpus | URN | Lisenssi URL (jos on) | Lisenssi | LBR/Hae Lupa | Deposition agreement | Tyyppi | IDA | Sijainti: URN | Sijainti: Nimi | Dokumentaatio | Tekijä | Author | First publication date | Kielipankki publication date | Other / Links | ||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 100suom | Sata suomalaista kielellistä elämäkertaa | Hundred Finnish Linguistic Life Stories | B | Hanna Lappalainen | https://blogs.helsinki.fi/100suomalaista/ | Sata suomalaista kielellistä elämäkertaa | Hundred Finnish Linguistic Life Stories | urn:nbn:fi:lb-2019092003 | No | P | Yes | {Helsingin yliopisto} | {University of Helsinki} | 2019 | https://blogs.helsinki.fi/100suomalaista/ | ||||||||||||||||
| Akkala | Puhutun ja kirjoitetun akkalansaamen korpus | The Corpus of Spoken and Written Akkala Saami | Michael Riessler | Puhutun ja kirjoitetun akkalansaamen korpus | The Corpus of Spoken and Written Akkala Saami | urn:nbn:fi:lb-2015111201 | No | T | |||||||||||||||||||||||
| amph-korp | Ajatella, miettiä, pohtia, harkita -korpuksen Helsinki-Korp-versio | amph-Corpus, Helsinki Korp Version | Antti Arppe | Ajatella, miettiä, pohtia, harkita -korpuksen Helsinki-Korp-versio | amph-Corpus, Helsinki Korp Version | urn:nbn:fi:lb-2017022802 | Yes | T | No | Antti Arppe | Antti Arppe | 2008 | |||||||||||||||||||
| coha-dl-2021 | Corpus of Historical American English - Kielipankin ladattava versio 2021 | Corpus of Historical American English - Kielipankki download version 2021 | ![]() | FIN-CLARIN | Corpus of Historical American English - Kielipankin ladattava versio 2021 | Corpus of Historical American English - Kielipankki download version 2021 | urn:nbn:fi:lb-2023030601 | http://urn.fi/urn:nbn:fi:lb-2017072507 | RES-fi | T | http://urn.fi/urn:nbn:fi:lb-2017061924 | Mark Davies | Mark Davies | 2023 | |||||||||||||||||
| coronavirus-ecorg-2021-05-src | The Coronavirus Corpus (Mark Davies, english-corpora.org) - Kielipankin versio 2021-05, lähdemateriaali | The Coronavirus Corpus (Mark Davies, english-corpora.org) - Kielipankki version 2021-05, source | ![]() | B | FIN-CLARIN | The Coronavirus Corpus (Mark Davies, english-corpora.org) - Kielipankin versio 2021-05, lähdemateriaali | The Coronavirus Corpus (Mark Davies, english-corpora.org) - Kielipankki version 2021-05, source | urn:nbn:fi:lb-2022111701 | http://urn.fi/urn:nbn:fi:lb-2022111703 | RES-fi | T | Mark Davies | Mark Davies | 2020 | 2022 | ||||||||||||||||
| DIALUKI | DIALUKI - toisen ja vieraan kielen lukemisen ja kirjoittamisen diagnosointi | DIALUKI - Diagnosing reading and writing in a second or foreign language | ![]() | Ari Huhta | DIALUKI - toisen ja vieraan kielen lukemisen ja kirjoittamisen diagnosointi | DIALUKI - Diagnosing reading and writing in a second or foreign language | urn:nbn:fi:lb-20140730161 | http://urn.fi/urn:nbn:fi:lb-20150304138 | Yes | T | |||||||||||||||||||||
| digitala-autumn2021 | DigiTala: lukioissa ja yliopistossa kerätty S2-aineisto, syksy 2021 | DigiTala: L2 Finnish data from upper secondary schools and university, autumn 2021 | ![]() | B | Anna von Zansen | https://zenodo.org/communities/digitala/about/ | DigiTala: lukioissa ja yliopistossa kerätty S2-aineisto, syksy 2021 | DigiTala: L2 Finnish data from upper secondary schools and university, autumn 2021 | urn:nbn:fi:lb-2023012625 | http://urn.fi/urn:nbn:fi:lb-2023012627 | No | P | http://urn.fi/urn:nbn:fi:lb-2023012626 | Anna von Zansen; Yaroslav Getman; Milla Sneck; Heini Kallio; Ragheb Al-Ghezi; Ekaterina Voskoboinik; Maria Kautonen; Ari Huhta; Mikko Kuronen; Mikko Kurimo; Raili Hildén | Anna von Zansen; Yaroslav Getman; Milla Sneck; Heini Kallio; Ragheb Al-Ghezi; Ekaterina Voskoboinik; Maria Kautonen; Ari Huhta; Mikko Kuronen; Mikko Kurimo; Raili Hildén | https://zenodo.org/communities/digitala/about/ | |||||||||||||||
| digitala-spring2021 | DigiTala: lukioissa kerätty S2-aineisto, kevät 2021 | DigiTala: L2 Finnish data from upper secondary schools, spring 2021 | ![]() | B | Anna von Zansen | https://zenodo.org/communities/digitala/about/ | DigiTala: lukioissa kerätty S2-aineisto, kevät 2021 | DigiTala: L2 Finnish data from upper secondary schools, spring 2021 | urn:nbn:fi:lb-2023012621 | http://urn.fi/urn:nbn:fi:lb-2023012623 | No | P | http://urn.fi/urn:nbn:fi:lb-2023012622 | Anna von Zansen; Yaroslav Getman; Milla Sneck; Heini Kallio; Ragheb Al-Ghezi; Ekaterina Voskoboinik; Maria Kautonen; Ari Huhta; Mikko Kuronen; Mikko Kurimo; Raili Hildén | Anna von Zansen; Yaroslav Getman; Milla Sneck; Heini Kallio; Ragheb Al-Ghezi; Ekaterina Voskoboinik; Maria Kautonen; Ari Huhta; Mikko Kuronen; Mikko Kurimo; Raili Hildén | https://zenodo.org/communities/digitala/about/ | |||||||||||||||
| digitala-yki | DigiTalan YKI-aineisto | DigiTala's YKI data | ![]() | B | Heini Kallio | https://zenodo.org/communities/digitala/about/ | DigiTalan YKI-aineisto | DigiTala's YKI data | urn:nbn:fi:lb-2023012629 | http://urn.fi/urn:nbn:fi:lb-2023012631 | No | P | http://urn.fi/urn:nbn:fi:lb-2023012630 | Heini Kallio; Sari Ohranen; Tuija Hirvelä; Ari Huhta; Anna von Zansen; Yaroslav Getman; Ekaterina Voskoboinik; Ragheb Al-Ghezi; Milla Sneck; Mikko Kuronen; Mikko Kurimo; Raili Hildén | Heini Kallio; Sari Ohranen; Tuija Hirvelä; Ari Huhta; Anna von Zansen; Yaroslav Getman; Ekaterina Voskoboinik; Ragheb Al-Ghezi; Milla Sneck; Mikko Kuronen; Mikko Kurimo; Raili Hildén | https://zenodo.org/communities/digitala/about/ | |||||||||||||||
| dma-v2 | Digitaalinen muoto-opin arkisto, uusi versio | Digital Morphology Archives, new version | ![]() | VRT | Digitaalinen muoto-opin arkisto, uusi versio | Digital Morphology Archives, new version | http://creativecommons.org/licenses/by/4.0/ | Yes | T | Almost | {Helsingin yliopisto, suomen kielen, suomalais-ugrilaisten ja pohjoismaisten kielten ja kirjallisuuksien laitos} | {University of Helsinki, The Department of Finnish, Finno-Ugrian and Scandinavian Studies} | 2003 | ||||||||||||||||||
| dma-wn-fn-src | Muoto-opin arkiston sanaliput sekä keruukertomukset, lähdemateriaali | The Word Notes of the Morphology Archives with field reports, source | ![]() | Muoto-opin arkiston sanaliput sekä keruukertomukset, lähdemateriaali | The Word Notes of the Morphology Archives with field reports, source | urn:nbn:fi:lb-2021083001 | http://urn.fi/urn:nbn:fi:lb-2016042201 | RES PRIV ND | Yes | T | Yes | http://urn.fi/urn:nbn:fi:lb-2021061101 | {Helsingin yliopisto, suomen kielen, suomalais-ugrilaisten ja pohjoismaisten kielten ja kirjallisuuksien laitos} | {University of Helsinki, The Department of Finnish, Finno-Ugrian and Scandinavian Studies} | |||||||||||||||||
| dma-wn-src | Digitaalisen muoto-opin arkiston sanaliput, lähdemateriaali | The Word Notes of the Digital Morphology Archives, source | ![]() | Digitaalisen muoto-opin arkiston sanaliput, lähdemateriaali | The Word Notes of the Digital Morphology Archives, source | urn:nbn:fi:lb-202005191 | http://urn.fi/urn:nbn:fi:lb-2016042201 | RES PRIV ND | Yes | T | Yes | http://urn.fi/urn:nbn:fi:lb-2021061101 | {Helsingin yliopisto, suomen kielen, suomalais-ugrilaisten ja pohjoismaisten kielten ja kirjallisuuksien laitos} | {University of Helsinki, The Department of Finnish, Finno-Ugrian and Scandinavian Studies} | 2003 | ||||||||||||||||
| DSPCON2013-2015-korp | Aalto-yliopiston DSP-kurssin keskustelukorpus 2013-2015, Helsinki-Korp-version | Aalto University DSP Course Conversation Corpus 2013-2015, Helsinki Korp Version | Mikko Kurimo, Seppo Enarvi | Aalto-yliopiston DSP-kurssin keskustelukorpus 2013-2015, Helsinki-Korp-version | Aalto University DSP Course Conversation Corpus 2013-2015, Helsinki Korp Version | urn:nbn:fi:lb-2017030101 | Yes | T | No | {Aalto-yliopisto, Signaalinkäsittelyn ja akustiikan laitos} | {Aalto University, Department of Signal Processing and Acoustics} | 2016 | |||||||||||||||||||
| eduskunta-v2-dl | Eduskunnan täysistunnot, ladattava versio 2 | Plenary Sessions of the Parliament of Finland, Downloadable Version 2 | Eduskunnan täysistunnot, ladattava versio 2 | Plenary Sessions of the Parliament of Finland, Downloadable Version 2 | No | P | No | https://www.kielipankki.fi/aineistot/eduskunta/ | {Eduskunta} | {The Parliament of Finland} | |||||||||||||||||||||
| eduskunta-v2-korp | Eduskunnan täysistunnot, Kielipankin Korp-versio 2 | Plenary Sessions of the Parliament of Finland, Kielipankki Korp Version 2 | Eduskunnan täysistunnot, Kielipankin Korp-versio 2 | Plenary Sessions of the Parliament of Finland, Kielipankki Korp Version 2 | No | T | No | https://www.kielipankki.fi/aineistot/eduskunta/ | {Eduskunta} | {The Parliament of Finland} | |||||||||||||||||||||
| enets | Enetsin korpus | Enets Corpus | Olesya Khanina | Enetsin korpus | Enets Corpus | No | P | No | Olesya Khanina | Olesya Khanina | |||||||||||||||||||||
| english-uhlcs-korp | Englannin korpuksen (UHLCS) Helsinki-Korp-versio | English Corpus (UHLCS), Helsinki Korp Version | Englannin korpuksen (UHLCS) Helsinki-Korp-versio | English Corpus (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017030701 | Yes | T | No | Kristiina Jokinen | Kristiina Jokinen | 2007 | ||||||||||||||||||||
| erme-dl | ERME Ersän ja mokšan laajennettu korpus, kokotekstit/ladattava versio | ERME Erzya and Moksha Extended Corpora, full text/download version | Jack Rueter | ERME Ersän ja mokšan laajennettu korpus, kokotekstit/ladattava versio | ERME Erzya and Moksha Extended Corpora, full text/download version | Yes | T | Jack Rueter; Olga Yerina | Jack Rueter; Olga Yerina | ||||||||||||||||||||||
| Ersä | Ersän puhekielen korpus | Corpus of Colloquial Erzya | Riho Grünthal | Ersän puhekielen korpus | Corpus of Colloquial Erzya | urn:nbn:fi:lb-2014073034 | Yes | P | |||||||||||||||||||||||
| erzya-moksha-komi-uhlcs-korp | Ersän ja mokšan kirjallisuutta ja julkaisuja ja komisyrjäänin kirjallisuutta (UHLCS), Helsinki-Korp-versio | Corpus of Erzya and Moksha Mordvin Literature and Journals and Komi Zyrian Literature (UHLCS), Helsinki Korp Version | Ersän ja mokšan kirjallisuutta ja julkaisuja ja komisyrjäänin kirjallisuutta (UHLCS), Helsinki-Korp-versio | Corpus of Erzya and Moksha Mordvin Literature and Journals and Komi Zyrian Literature (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022816 | Yes | T | No | Jack Rueter | Jack Rueter | 2007 | ||||||||||||||||||||
| erzya-moksha-uhlcs-korp | Ersän ja mokšan sanaluettelokorpuksen (UHLCS) Helsinki-Korp-versio | Erzya and Moksha Mordvin Word List Corpus (UHLCS), Helsinki Korp Version | Ersän ja mokšan sanaluettelokorpuksen (UHLCS) Helsinki-Korp-versio | Erzya and Moksha Mordvin Word List Corpus (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022824 | Yes | T | No | Dennis Estill | Dennis Estill | 2007 | ||||||||||||||||||||
| estonian1-uhlcs-korp | Viron korpus 1:n (UHLCS) Helsinki-Korp-versio | Estonian Corpus 1 (UHLCS), Helsinki Korp Version | Viron korpus 1:n (UHLCS) Helsinki-Korp-versio | Estonian Corpus 1 (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022822 | Yes | T | No | Kazuto Matsumura | Kazuto Matsumura | 2007 | ||||||||||||||||||||
| estonian2-uhlcs-korp | Viron korpus 2:n (UHLCS) Helsinki-Korp-versio | Estonian Corpus 2 (UHLCS), Helsinki Korp Version | Viron korpus 2:n (UHLCS) Helsinki-Korp-versio | Estonian Corpus 2 (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022823 | Yes | T | No | Maria Vilkuna | Maria Vilkuna | 2007 | ||||||||||||||||||||
| fcaa | Keskusteluntutkimuksen arkisto | Finnish Conversation Analysis Archive | Mari Siiroinen | https://metashare.csc.fi/repository/browse/finnish-conversation-analysis-archive/65669f5eb7e611eb9cdefa163ec5ae3e69c8f5f510064ad999f16144700b1156/ | Keskusteluntutkimuksen arkisto | Finnish Conversation Analysis Archive | RES PRIV | No | P | https://metashare.csc.fi/repository/browse/finnish-conversation-analysis-archive/65669f5eb7e611eb9cdefa163ec5ae3e69c8f5f510064ad999f16144700b1156/ | |||||||||||||||||||||
| fedidi | Murteita käsittelevien fennististen väitöskirjojen lähdetietokanta | Citation Database of Fennistic Dialect Dissertations | Murteita käsittelevien fennististen väitöskirjojen lähdetietokanta | Citation Database of Fennistic Dialect Dissertations | urn:nbn:fi:lb-2018092801 | No | T | Yes | Lotta Aarikka | Lotta Aarikka | |||||||||||||||||||||
| findarc | Suomenkielisen pimeän verkon kauppapaikka-aineisto | Finnish Dark Web Marketplace Corpus | ![]() | B | Tuomas Harviainen | Suomenkielisen pimeän verkon kauppapaikka-aineisto | Finnish Dark Web Marketplace Corpus | urn:nbn:fi:lb-2022062221 | http://urn.fi/urn:nbn:fi:lb-2022062222 | Yes | T | http://urn.fi/urn:nbn:fi:lb-2022062226 | Tuomas Harviainen | Tuomas Harviainen | |||||||||||||||||
| finears | Suomalaisen elektroakustisen musiikin haastatteluaineisto | Finnish electroacoustic music interviews | Mikko Ojanen | https://blogs.helsinki.fi/finnish-electroacoustic-resources/ | Suomalaisen elektroakustisen musiikin haastatteluaineisto | Finnish electroacoustic music interviews | urn:nbn:fi:lb-2020030421 | RES PRIV | No | P | Mikko Ojanen | Mikko Ojanen | https://blogs.helsinki.fi/finnish-electroacoustic-resources/ | ||||||||||||||||||
| FinIntas | The FinINTAS Corpus of Spontaneous and Read-aloud Finnish Speech | The FinINTAS Corpus of Spontaneous and Read-aloud Finnish Speech | Mietta Lennes | The FinINTAS Corpus of Spontaneous and Read-aloud Finnish Speech | The FinINTAS Corpus of Spontaneous and Read-aloud Finnish Speech | urn:nbn:fi:lb-20140730194 | No | P | |||||||||||||||||||||||
| finlangus | Amerikansuomalaisten siirtolaisten ja verrokkipuhujien puhuttu suomen kieli ja kielelliset tehtävät | Spoken language and linguistic tasks of Finnish-American immigrants and controls | Nana Lehtinen | Amerikansuomalaisten siirtolaisten ja verrokkipuhujien puhuttu suomen kieli ja kielelliset tehtävät | Spoken language and linguistic tasks of Finnish-American immigrants and controls | No | P | Nana Lehtinen | Nana Lehtinen | ||||||||||||||||||||||
| finnish-bibles-uhlcs-korp | Suomen korpus (raamatut) (UHLCS), Helsinki-Korp-versio | Finnish Corpus (Bibles) (UHLCS), Helsinki Korp Version | Suomen korpus (raamatut) (UHLCS), Helsinki-Korp-versio | Finnish Corpus (Bibles) (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022820 | Yes | T | No | Anssi Yli-Jyrä | Anssi Yli-Jyrä | 2007 | ||||||||||||||||||||
| finnish-literature-uhlcs-korp | Suomen korpus (kirjallisuutta) (UHLCS), Helsinki-Korp-versio | Finnish Corpus (Literature) (UHLCS), Helsinki Korp Version | Suomen korpus (kirjallisuutta) (UHLCS), Helsinki-Korp-versio | Finnish Corpus (Literature) (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022821 | Yes | T | No | Helsingin yliopisto | University of Helsinki | 2007 | ||||||||||||||||||||
| FinnTreeBank1-korp | Suomen puupankki FinnTreeBank 1:n Helsinki-Korp-versio | The Helsinki Korp Version of the Finnish TreeBank 1 | ![]() | Suomen puupankki FinnTreeBank 1:n Helsinki-Korp-versio | The Helsinki Korp Version of the Finnish TreeBank 1 | urn:nbn:fi:lb-2017030102 | https://creativecommons.org/licenses/by-nc-nd/4.0/legalcode | Yes | T | No | {Helsingin yliopisto} | {University of Helsinki} | 2010 | ||||||||||||||||||
| ha-korp | Ha-kieliaineiston Helsinki-Korp-versio | Ha Language Corpus, Helsinki Korp Version | ![]() | Lotta Aunio | Ha-kieliaineiston Helsinki-Korp-versio | Ha Language Corpus, Helsinki Korp Version | urn:nbn:fi:lb-2017022101 | http://creativecommons.org/licenses/by/4.0/ | Yes | T | No | Lotta Aunio | Lotta Aunio | ||||||||||||||||||
| hanty-uhlcs-korp | Hantin korpus (pohjoishantin aineistot ja käännökset) (UHLCS), Helsinki-Korp-versio | Khanty Corpus (North Khanty, Corpora and Translations) (UHLCS), Helsinki Korp Version | Hantin korpus (pohjoishantin aineistot ja käännökset) (UHLCS), Helsinki-Korp-versio | Khanty Corpus (North Khanty, Corpora and Translations) (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022818 | Yes | T | No | Merja Salo | Merja Salo | 2007 | ||||||||||||||||||||
| helpuhe-2010txt | Helsingin puhekielen pitkittäiskorpus (2010-luvun tekstimuotoinen aineisto) | The Longitudinal Corpus of Finnish Spoken in Helsinki (2010 in text form) | Hanna Lappalainen | Helsingin puhekielen pitkittäiskorpus (2010-luvun tekstimuotoinen aineisto) | The Longitudinal Corpus of Finnish Spoken in Helsinki (2010 in text form) | urn:nbn:fi:lb-2014073040 | Yes | T | Almost | https://www.kielipankki.fi/aineistot/helpuhe/ | Hanna Lappalainen | Hanna Lappalainen | |||||||||||||||||||
| helpuhe-v2-korp | Helsingin puhekielen pitkittäiskorpuksen (1970, 1990, 2010) Helsinki Korp versio 2 | The Longitudinal Corpus of Finnish Spoken in Helsinki (1970s, 1990s and 2010s), Helsinki Korp Version 2 | ![]() | Hanna Lappalainen | Helsingin puhekielen pitkittäiskorpuksen (1970, 1990, 2010) Helsinki Korp versio 2 | The Longitudinal Corpus of Finnish Spoken in Helsinki (1970s, 1990s and 2010s), Helsinki Korp Version 2 | urn:nbn:fi:lb-2016051602 | http://urn.fi/urn:nbn:fi:lb-2015041303 | Yes | T | https://www.kielipankki.fi/aineistot/helpuhe/ | ||||||||||||||||||||
| helpuhe-v2-lat | Helsingin puhekielen pitkittäiskorpuksen (1970, 1990, 2010) Helsinki LAT versio 2 | The Longitudinal Corpus of Finnish Spoken in Helsinki (1970s, 1990s and 2010s), Helsinki LAT Version 2 | ![]() | B | Hanna Lappalainen | Helsingin puhekielen pitkittäiskorpuksen (1970, 1990, 2010) Helsinki LAT versio 2 | The Longitudinal Corpus of Finnish Spoken in Helsinki (1970s, 1990s and 2010s), Helsinki LAT Version 2 | urn:nbn:fi:lb-2016051601 | http://urn.fi/urn:nbn:fi:lb-2015041303 | Yes | T | No | https://www.kielipankki.fi/aineistot/helpuhe/ | ||||||||||||||||||
| HS | Helsingin Sanomien arkisto -korpus | The Helsingin Sanomat Archive Corpus | Jarkko Rahkonen | Helsingin Sanomien arkisto -korpus | The Helsingin Sanomat Archive Corpus | urn:nbn:fi:lb-2014073036 | Yes | T | |||||||||||||||||||||||
| ingrian-uhlcs-korp | Inkeroisen korpuksen (UHLCS) Helsinki-Korp-versio | Ingrian Corpus (UHLCS), Helsinki Korp Version | Inkeroisen korpuksen (UHLCS) Helsinki-Korp-versio | Ingrian Corpus (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022819 | Yes | T | No | Manja Lehto | Manja Lehto | 2007 | ||||||||||||||||||||
| Inkerin murteet | Inkerin murteiden korpus | The Corpus of Ingrian Finnish | Marjatta Palander | www, muuta | Inkerin murteiden korpus | The Corpus of Ingrian Finnish | urn:nbn:fi:lb-2014073032 | No | P | www, muuta | |||||||||||||||||||||
| iweb-ecorg-src | The Intelligent Web Corpus (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali | The Intelligent Web Corpus (Mark Davies, english-corpora.org) - Kielipankki version, source | B | FIN-CLARIN | The Intelligent Web Corpus (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali | The Intelligent Web Corpus (Mark Davies, english-corpora.org) - Kielipankki version, source | urn:nbn:fi:lb-2022112306 | RES-fi | T | Mark Davies | Mark Davies | 2018 | 2022 | ||||||||||||||||||
| kikosa-haa | Oulun yliopiston Kikosa-kokoelma: Ryhmähaastattelut | University of Oulu Kikosa Collection: Group interviews | Maria Frick | Oulun yliopiston Kikosa-kokoelma: Ryhmähaastattelut | University of Oulu Kikosa Collection: Group interviews | urn:nbn:fi:lb-2022050221 | No | P | Yes | Oulun yliopisto | University of Oulu | ||||||||||||||||||||
| kikosa-kok | Oulun yliopiston Kikosa-kokoelma:Opiskelijakokoukset | University of Oulu Kikosa Collection: Student meetings | Maria Frick | Oulun yliopiston Kikosa-kokoelma:Opiskelijakokoukset | University of Oulu Kikosa Collection: Student meetings | urn:nbn:fi:lb-2022050222 | No | P | Yes | Oulun yliopisto; Salla Niemetmaa | University of Oulu; Salla Niemetmaa | ||||||||||||||||||||
| Kiltinänsaame | Kirjoitetun kiltinänsaamen korpus | The Corpus of Written Kildin Saami | ![]() | Mikael Riessler | Kirjoitetun kiltinänsaamen korpus | The Corpus of Written Kildin Saami | urn:nbn:fi:lb-2015102001 | http://creativecommons.org/licenses/by/4.0/ | No | T | |||||||||||||||||||||
| Kiltinänsaame (UHLCS) | Kiltinänsaamen korpus (UHLCS) | Kildin Saami Corpus (UHLCS) | Pirkko Suihkonen | Kiltinänsaamen korpus (UHLCS) | Kildin Saami Corpus (UHLCS) | urn:nbn:fi:lb-2016012201 | Yes | T | No | ||||||||||||||||||||||
| klk-fi-v2-korp | Kansalliskirjaston sanoma- ja aikakauslehtikokoelman suomenkielinen osakorpus versio 2, Korp | The Finnish Sub-corpus of the Newspaper and Periodical Corpus of the National Library of Finland version 2, Korp | FIN-CLARIN | Kansalliskirjaston sanoma- ja aikakauslehtikokoelman suomenkielinen osakorpus versio 2, Korp | The Finnish Sub-corpus of the Newspaper and Periodical Corpus of the National Library of Finland version 2, Korp | urn:nbn:fi:lb-202009152 | PUB CC BY | T | http://urn.fi/urn:nbn:fi:lb-2021092404 | {Kansalliskirjasto} | {National Library of Finland} | 2023 | |||||||||||||||||||
| komi-ikdp | Puhutun komin korpus: IKDP | Spoken Komi Corpus: IKDP | Niko Partanen | Puhutun komin korpus: IKDP | Spoken Komi Corpus: IKDP | urn:nbn:fi:lb-2019121603 | No | P | No | Rogier Blokland; Michael Riessler; Niko Partanen | Rogier Blokland; Michael Riessler; Niko Partanen | ||||||||||||||||||||
| komi-uhlcs-korp | Komisyrjäänin korpuksen (UHLCS) Helsinki-Korp-versio | Komi Zyrian Corpus (UHLCS), Helsinki Korp Version | Komisyrjäänin korpuksen (UHLCS) Helsinki-Korp-versio | Komi Zyrian Corpus (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022817 | Yes | T | No | Paula Kokkonen | Paula Kokkonen | 2007 | ||||||||||||||||||||
| kra-korp | Keskiranskan korpuksen Helsinki-Korp-versio | Jyväskylä Corpus of Middle French, Helsinki Korp Version | Keskiranskan korpuksen Helsinki-Korp-versio | Jyväskylä Corpus of Middle French, Helsinki Korp Version | urn:nbn:fi:lb-2017022806 | Yes | T | No | {Jyväskylän yliopisto, kielten laitos} | {University of Jyväskylä, Department of Languages} | 1999 | ||||||||||||||||||||
| latin-uhlcs-korp | Latinan korpuksen (UHLCS) Helsinki-Korp-versio | Latin Corpus (UHLCS), Helsinki Korp Version | Latinan korpuksen (UHLCS) Helsinki-Korp-versio | Latin Corpus (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022815 | Yes | T | No | Martti Nyman | Martti Nyman | 2007 | ||||||||||||||||||||
| long-second | Long Second -korpus: Suomen kielen kehittyminen alakoulun valmistavalla luokalla | The Long Second Corpus: LONGitudinal Classroom Data about Children’s Development in Finnish as a SECOND Language | Maria Ahlholm | Long Second -korpus: Suomen kielen kehittyminen alakoulun valmistavalla luokalla | The Long Second Corpus: LONGitudinal Classroom Data about Children’s Development in Finnish as a SECOND Language | urn:nbn:fi:lb-2015031801 | Almost | P | No | Maria Ahlholm | Maria Ahlholm | ||||||||||||||||||||
| Lönnrot | Elias Lönnrotin kirjeenvaihto | Elias Lönnrot Letters Online | ![]() | Kirsi Keravuori | www | Elias Lönnrotin kirjeenvaihto | Elias Lönnrot Letters Online | urn:nbn:fi:lb-2017082201 | https://creativecommons.org/licenses/by-sa/4.0/legalcode | Yes | T | www | |||||||||||||||||||
| lude-uhlcs-korp | Lyydin korpuksen (UHLCS) Helsinki-Korp-versio | Lude (Ludian) Corpus (UHLCS), Helsinki Korp Version | Lyydin korpuksen (UHLCS) Helsinki-Korp-versio | Lude (Ludian) Corpus (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022813 | Yes | T | No | Miikul Pahomov | Miikul Pahomov | 2007 | ||||||||||||||||||||
| medievalturku | Turun keskiaikaisten asiakirjojen maamerkkien korpus, lähdeaineisto | Corpus of landscapes in medieval documents from Turku, source | ![]() | B | Hanna-Mari Kupari | Turun keskiaikaisten asiakirjojen maamerkkien korpus, lähdeaineisto | Corpus of landscapes in medieval documents from Turku, source | urn:nbn:fi:lb-2023032021 | http://urn.fi/urn:nbn:fi:lb-2023032023 | No | T | No | http://urn.fi/urn:nbn:fi:lb-2023032022 | Hanna-Mari Kupari; Marko Lamberg | Hanna-Mari Kupari; Marko Lamberg | https://github.com/HannaKoo/landscapes | |||||||||||||||
| mepu-src | Puhutun meänkielen korpus, lähdeaineisto | Corpus of Spoken Meänkieli, source | ![]() | B | Niina Kunnas | Puhutun meänkielen korpus, lähdeaineisto | Corpus of Spoken Meänkieli, source | urn:nbn:fi:lb-2022112921 | http://urn.fi/urn:nbn:fi:lb-2022112923 | No | P | No | http://urn.fi/urn:nbn:fi:lb-2022112922 | Niina Kunnas; Veikka Ritola; Jenna Vikman | Niina Kunnas; Veikka Ritola; Jenna Vikman | ||||||||||||||||
| mlcca | MLCCA, Monikielinen sopimustekstien korpus | MLCCA, Multilingual Corpus of Contracts and Agreements | ![]() | A | Mikhail Mikhailov | MLCCA, Monikielinen sopimustekstien korpus | MLCCA, Multilingual Corpus of Contracts and Agreements | urn:nbn:fi:lb-2022101821 | http://urn.fi/urn:nbn:fi:lb-2022101823 | No | T | http://urn.fi/urn:nbn:fi:lb-2022101822 | Mikhail Mikhailov; Julia Souma | Mikhail Mikhailov; Julia Souma | 2020 | ||||||||||||||||
| movie-ecorg-src | The Movie Corpus (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali | The Movie Corpus (Mark Davies, english-corpora.org) - Kielipankki version, source | B | FIN-CLARIN | The Movie Corpus (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali | The Movie Corpus (Mark Davies, english-corpora.org) - Kielipankki version, source | urn:nbn:fi:lb-2022112301 | RES-fi | T | Mark Davies | Mark Davies | 2019 | 2022 | ||||||||||||||||||
| mutable-src | Kuvailutulkkaus sokeiden ja näkevien yhteistyönä | Multimodal Translation with the Blind | B | Maija Hirvonen | https://projects.tuni.fi/mutable/the-mutable-corpus/ | Kuvailutulkkaus sokeiden ja näkevien yhteistyönä | Multimodal Translation with the Blind | urn:nbn:fi:lb-2021042021 | No | P | No | Maija Hirvonen | Maija Hirvonen | https://projects.tuni.fi/mutable/the-mutable-corpus/ | |||||||||||||||||
| nenets-uhlcs-korp | Nenetsin korpuksen (UHLCS) Helsinki-Korp-versio | Nenets Corpus (Tundra Nenets) (UHLCS), Helsinki Korp Version | Nenetsin korpuksen (UHLCS) Helsinki-Korp-versio | Nenets Corpus (Tundra Nenets) (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022812 | Yes | T | No | Tapani Salminen | Tapani Salminen | 2007 | ||||||||||||||||||||
| Nganasan | Nganasanin kielen puhekorpus | Nganasan Speech Corpus | Larisa Leisiö | Nganasanin kielen puhekorpus | Nganasan Speech Corpus | urn:nbn:fi:lb-2014100302 | Yes | P | |||||||||||||||||||||||
| nmk-korp | Nimimaiseman muutos -korpuksen Helsinki Korp -versio | Changes in Place Names Corpus, Helsinki Korp Version | ![]() | Elisa Stenvall | Nimimaiseman muutos -korpuksen Helsinki Korp -versio | Changes in Place Names Corpus, Helsinki Korp Version | urn:nbn:fi:lb-2016031702 | https://www.kielipankki.fi/lic/nmk/ | Yes | T | |||||||||||||||||||||
| nmk-lat | Nimimaiseman muutos -korpuksen Helsinki LAT -versio | Changes in Place Names Corpus, Helsinki LAT Version | ![]() | Elisa Stenvall | Nimimaiseman muutos -korpuksen Helsinki LAT -versio | Changes in Place Names Corpus, Helsinki LAT Version | urn:nbn:fi:lb-2016031702 | https://www.kielipankki.fi/lic/nmk/ | Yes | P | |||||||||||||||||||||
| NorDiga | Nordican digitaalinen arkisto | The Nordica Digital Archive | Jan Lindström | www | Nordican digitaalinen arkisto | The Nordica Digital Archive | urn:nbn:fi:lb-2016032401 | No | T | No | www | ||||||||||||||||||||
| north-saami-literature-uhlcs-korp | Pohjoissaamen korpus (kirjallisuutta) (UHLCS), Helsinki-Korp-versio | North Saami Corpus (Literature) (UHLCS), Helsinki Korp Version | Pohjoissaamen korpus (kirjallisuutta) (UHLCS), Helsinki-Korp-versio | North Saami Corpus (Literature) (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022810 | Yes | T | No | Kerttu Vuolab | Kerttu Vuolab | 2007 | ||||||||||||||||||||
| north-saami-report-uhlcs-korp | Pohjoissaamen korpuksen (Sámikultuvradoaibmagotti smiehttamush) (UHLCS) Helsinki-Korp-versio | North Saami Corpus (Sámikultuvradoaibmagotti smiehttamush) (UHLCS), Helsinki Korp Version Corpus | Pohjoissaamen korpuksen (Sámikultuvradoaibmagotti smiehttamush) (UHLCS) Helsinki-Korp-versio | North Saami Corpus (Sámikultuvradoaibmagotti smiehttamush) (UHLCS), Helsinki Korp Version Corpus | urn:nbn:fi:lb-2017022811 | Yes | T | No | Irja Seurujärvi-Kari | Irja Seurujärvi-Kari | 2007 | ||||||||||||||||||||
| now-ecorg-2021-05-src | News on the Web (Mark Davies, english-corpora.org) - Kielipankin versio 2021-05, lähdemateriaali | News on the Web (Mark Davies, english-corpora.org) - Kielipankki version 2021-05, source | B | FIN-CLARIN | News on the Web (Mark Davies, english-corpora.org) - Kielipankin versio 2021-05, lähdemateriaali | News on the Web (Mark Davies, english-corpora.org) - Kielipankki version 2021-05, source | urn:nbn:fi:lb-2022112401 | RES-fi | T | Mark Davies | Mark Davies | 2016 | 2022 | ||||||||||||||||||
| nzadi | Nzadin korpus | Nzadi Corpus | Thera Marie Crane | Nzadin korpus | Nzadi Corpus | No | P | No | Thera Marie Crane; Larry Hyman; Simon Tukumu | Thera Marie Crane; Larry Hyman; Simon Tukumu | |||||||||||||||||||||
| ona | Oulun nauhoitearkisto | The Audio Recordings Archive of Oulu (ONA) | ![]() | Niina Kunnas | Oulun nauhoitearkisto | The Audio Recordings Archive of Oulu (ONA) | urn:nbn:fi:lb-2016110701 | http://urn.fi/urn:nbn:fi:lb-2016121616 | RES NC PRIV DEP | Yes | P | {Oulun yliopisto, suomen kielen oppiaine} | {University of Oulu, Department of Finnish Language} | ||||||||||||||||||
| Opus ECB | Opus EKP -korpus | Opus ECB Corpus | ![]() | Jörg Tiedemann | Opus EKP -korpus | Opus ECB Corpus | urn:nbn:fi:lb-2016012801 | http://creativecommons.org/licenses/by-nc/4.0/ | T | Yes | |||||||||||||||||||||
| Opus EU | Opus EU -korpus | Opus EU Corpus | ![]() | Jörg Tiedemann | Opus EU -korpus | Opus EU Corpus | urn:nbn:fi:lb-2016012802 | http://creativecommons.org/licenses/by/4.0/ | T | Yes | |||||||||||||||||||||
| Opus Localization | Opus lokalisointi -korpus | Opus Localization Corpus | Jörg Tiedemann | Opus lokalisointi -korpus | Opus Localization Corpus | urn:nbn:fi:lb-2016012803 | https://opensource.org/licenses/MIT | T | Yes | ||||||||||||||||||||||
| Opus Subtitles | Opus tekstitys -korpus | Opus Subtitles Corpus | ![]() | Jörg Tiedemann | Opus tekstitys -korpus | Opus Subtitles Corpus | urn:nbn:fi:lb-2016012804 | http://creativecommons.org/licenses/by-nc/4.0/ | T | Yes | |||||||||||||||||||||
| oulu-korp | Oulun korpuksen Helsinki-Korp-versio | Oulu Corpus, Helsinki Korp Version | Oulun korpuksen Helsinki-Korp-versio | Oulu Corpus, Helsinki Korp Version | urn:nbn:fi:lb-2017022805 | Yes | T | No | {Oulun yliopisto, suomen kielen oppiaine} | {University of Oulu, Department of Finnish Language} | 2013 | ||||||||||||||||||||
| parole-fi-korp | Suomen kielen Parole-korpuksen Helsinki-Korp-versio | The Finnish Parole Corpus, Helsinki Korp Version | Suomen kielen Parole-korpuksen Helsinki-Korp-versio | The Finnish Parole Corpus, Helsinki Korp Version | urn:nbn:fi:lb-2017022804 | Yes | T | No | {Helsingin yliopisto} | {University of Helsinki} | 1998 | ||||||||||||||||||||
| PERSO | PERSO Databases for Finnish Speech Synthesis | PERSO Databases for Finnish Speech Synthesis | Martti Vainio, Heini Kallio | PERSO Databases for Finnish Speech Synthesis | PERSO Databases for Finnish Speech Synthesis | urn:nbn:fi:lb-2014073053 | Yes | P | Almost | ||||||||||||||||||||||
| ProoF | ProoF - Maahanmuuttajien suomen kielen ääntäminen | ProoF - Pronunciation of Finnish by Immigrants in Finland | Mietta Lennes | ProoF - Maahanmuuttajien suomen kielen ääntäminen | ProoF - Pronunciation of Finnish by Immigrants in Finland | urn:nbn:fi:lb-20140730130 | No | P | |||||||||||||||||||||||
| Prosodiakorpus | Suomen kielen prosodian variaation korpus | Corpus of Prosodic Variation of Finnish | Tommi Kurki, Tommi Nieminen | Suomen kielen prosodian variaation korpus | Corpus of Prosodic Variation of Finnish | urn:nbn:fi:lb-2014090803 | No | P | |||||||||||||||||||||||
| puhelahjat-annotated | Lahjoita puhetta: Annotoitu aineisto | Donate Speech: Annotated dataset | ![]() | A | FIN-CLARIN | https://www.kielipankki.fi/lahjoita-puhetta/ | Lahjoita puhetta: Annotoitu aineisto | Donate Speech: Annotated dataset | urn:nbn:fi:lb-2022060128 | http://urn.fi/urn:nbn:fi:lb-2022020223 | Yes | P | https://www.kielipankki.fi/aineistot/puhelahjat/ | {Helsingin yliopisto} | {University of Helsinki} | 2023 | 2023 | https://www.kielipankki.fi/lahjoita-puhetta/ | |||||||||||||
| puhelahjat-dev | Lahjoita puhetta, Valikoitu aineisto: Kehitysdata (10h) | Donate Speech: Selected dataset, Development data (10h) | ![]() | A | Anssi Moisio | https://www.kielipankki.fi/lahjoita-puhetta/ | Lahjoita puhetta, Valikoitu aineisto: Kehitysdata (10h) | Donate Speech: Selected dataset, Development data (10h) | urn:nbn:fi:lb-2022060121 | http://urn.fi/urn:nbn:fi:lb-2022020223 | Yes | P | https://www.kielipankki.fi/aineistot/puhelahjat/ | {Helsingin yliopisto} | {University of Helsinki} | 2022 | 2022 | https://www.kielipankki.fi/lahjoita-puhetta/ | |||||||||||||
| puhelahjat-dev | Lahjoita puhetta, Valikoitu aineisto: Kehitysdata (10h) (yrityskäyttöön) | Donate Speech, Selected dataset: Development data (10h) (commercial use) | A | Anssi Moisio | https://www.kielipankki.fi/lahjoita-puhetta/ | Lahjoita puhetta, Valikoitu aineisto: Kehitysdata (10h) (yrityskäyttöön) | Donate Speech, Selected dataset: Development data (10h) (commercial use) | urn:nbn:fi:lb-2022060121 | http://urn.fi/urn:nbn:fi:lb-2022060130 | Yes | P | https://www.kielipankki.fi/aineistot/puhelahjat-commercial/ | {Helsingin yliopisto} | {University of Helsinki} | 2023 | 2023 | https://www.kielipankki.fi/lahjoita-puhetta/ | ||||||||||||||
| puhelahjat-korp | Lahjoita puhetta -aineisto, Korp | Donate Speech Corpus, Korp | ![]() | A | FIN-CLARIN | Lahjoita puhetta -aineisto, Korp | Donate Speech Corpus, Korp | urn:nbn:fi:lb-2022112121 | http://urn.fi/urn:nbn:fi:lb-2022020223 | No | P | No | http://urn.fi/urn:nbn:fi:lb-2022112121 | http://urn.fi/urn:nbn:fi:lb-2022102122 | {Helsingin yliopisto} | {University of Helsinki} | 2022 | ||||||||||||||
| puhelahjat-selected | Lahjoita puhetta: Valikoitu aineisto | Donate Speech: Selected dataset | ![]() | A | FIN-CLARIN | https://www.kielipankki.fi/lahjoita-puhetta/ | Lahjoita puhetta: Valikoitu aineisto | Donate Speech: Selected dataset | urn:nbn:fi:lb-2022060127 | http://urn.fi/urn:nbn:fi:lb-2022020223 | Yes | P | https://www.kielipankki.fi/aineistot/puhelahjat/ | {Helsingin yliopisto} | {University of Helsinki} | 2023 | 2023 | https://www.kielipankki.fi/lahjoita-puhetta/ | |||||||||||||
| puhelahjat-test | Lahjoita puhetta, Valikoitu aineisto: Testidata (10h) | Donate Speech: Selected dataset, Test data (10h) | ![]() | A | Anssi Moisio | https://www.kielipankki.fi/lahjoita-puhetta/ | Lahjoita puhetta, Valikoitu aineisto: Testidata (10h) | Donate Speech: Selected dataset, Test data (10h) | urn:nbn:fi:lb-2022060122 | http://urn.fi/urn:nbn:fi:lb-2022020223 | Yes | P | https://www.kielipankki.fi/aineistot/puhelahjat/ | {Helsingin yliopisto} | {University of Helsinki} | 2022 | 2022 | https://www.kielipankki.fi/lahjoita-puhetta/ | |||||||||||||
| puhelahjat-test | Lahjoita puhetta, Valikoitu aineisto: Testidata (10h) (yrityskäyttöön) | Donate Speech, Selected dataset: Test data (10h) (commercial use) | A | Anssi Moisio | https://www.kielipankki.fi/lahjoita-puhetta/ | Lahjoita puhetta, Valikoitu aineisto: Testidata (10h) (yrityskäyttöön) | Donate Speech, Selected dataset: Test data (10h) (commercial use) | urn:nbn:fi:lb-2022060122 | http://urn.fi/urn:nbn:fi:lb-2022060130 | Yes | P | https://www.kielipankki.fi/aineistot/puhelahjat-commercial/ | {Helsingin yliopisto} | {University of Helsinki} | 2023 | 2023 | https://www.kielipankki.fi/lahjoita-puhetta/ | ||||||||||||||
| puhelahjat-test-mtr | Lahjoita puhetta, Valikoitu aineisto: Usean litteroijan testidata (1h) | Donate Speech: Selected dataset, Multi-transcriber test data (1h) | ![]() | A | Anssi Moisio | https://www.kielipankki.fi/lahjoita-puhetta/ | Lahjoita puhetta, Valikoitu aineisto: Usean litteroijan testidata (1h) | Donate Speech: Selected dataset, Multi-transcriber test data (1h) | urn:nbn:fi:lb-2022060124 | http://urn.fi/urn:nbn:fi:lb-2022020223 | Yes | P | https://www.kielipankki.fi/aineistot/puhelahjat/ | {Helsingin yliopisto} | {University of Helsinki} | 2022 | 2022 | https://www.kielipankki.fi/lahjoita-puhetta/ | |||||||||||||
| puhelahjat-test-mtr | Lahjoita puhetta, Valikoitu aineisto: Usean litteroijan testidata (1h) (yrityskäyttöön) | Donate Speech, Selected dataset: Multi-transcriber test data (1h) (commercial use) | A | Anssi Moisio | https://www.kielipankki.fi/lahjoita-puhetta/ | Lahjoita puhetta, Valikoitu aineisto: Usean litteroijan testidata (1h) (yrityskäyttöön) | Donate Speech, Selected dataset: Multi-transcriber test data (1h) (commercial use) | urn:nbn:fi:lb-2022060124 | http://urn.fi/urn:nbn:fi:lb-2022060130 | Yes | P | https://www.kielipankki.fi/aineistot/puhelahjat-commercial/ | {Helsingin yliopisto} | {University of Helsinki} | 2023 | 2023 | https://www.kielipankki.fi/lahjoita-puhetta/ | ||||||||||||||
| puhelahjat-test-mtrs | Lahjoita puhetta, Valikoitu aineisto: Testidata useaan kertaan litteroiduilta puhujilta (10h) | Donate Speech: Selected dataset, Test data from multi-transcriber speakers (10h) | ![]() | A | Anssi Moisio | https://www.kielipankki.fi/lahjoita-puhetta/ | Lahjoita puhetta, Valikoitu aineisto: Testidata useaan kertaan litteroiduilta puhujilta (10h) | Donate Speech: Selected dataset, Test data from multi-transcriber speakers (10h) | urn:nbn:fi:lb-2022060125 | http://urn.fi/urn:nbn:fi:lb-2022020223 | Yes | P | https://www.kielipankki.fi/aineistot/puhelahjat/ | {Helsingin yliopisto} | {University of Helsinki} | 2022 | 2022 | https://www.kielipankki.fi/lahjoita-puhetta/ | |||||||||||||
| puhelahjat-test-mtrs | Lahjoita puhetta, Valikoitu aineisto: Testidata useaan kertaan litteroiduilta puhujilta (10h) (yrityskäyttöön) | Donate Speech, Selected dataset: Test data from multi-transcriber speakers (10h) (commercial use) | A | Anssi Moisio | https://www.kielipankki.fi/lahjoita-puhetta/ | Lahjoita puhetta, Valikoitu aineisto: Testidata useaan kertaan litteroiduilta puhujilta (10h) (yrityskäyttöön) | Donate Speech, Selected dataset: Test data from multi-transcriber speakers (10h) (commercial use) | urn:nbn:fi:lb-2022060125 | http://urn.fi/urn:nbn:fi:lb-2022060130 | Yes | P | https://www.kielipankki.fi/aineistot/puhelahjat-commercial/ | {Helsingin yliopisto} | {University of Helsinki} | 2023 | 2023 | https://www.kielipankki.fi/lahjoita-puhetta/ | ||||||||||||||
| puhelahjat-train | Lahjoita puhetta, Valikoitu aineisto: Opetusdata (100h) | Donate Speech: Selected dataset, Training data (100h) | ![]() | A | Anssi Moisio | https://www.kielipankki.fi/lahjoita-puhetta/ | Lahjoita puhetta, Valikoitu aineisto: Opetusdata (100h) | Donate Speech: Selected dataset, Training data (100h) | urn:nbn:fi:lb-2022060123 | http://urn.fi/urn:nbn:fi:lb-2022020223 | Yes | P | https://www.kielipankki.fi/aineistot/puhelahjat/ | {Helsingin yliopisto} | {University of Helsinki} | 2022 | 2022 | https://www.kielipankki.fi/lahjoita-puhetta/ | |||||||||||||
| puhelahjat-train | Lahjoita puhetta, Valikoitu aineisto: Opetusdata (100h) (yrityskäyttöön) | Donate Speech, Selected dataset: Training data (100h) (commercial use) | A | Anssi Moisio | https://www.kielipankki.fi/lahjoita-puhetta/ | Lahjoita puhetta, Valikoitu aineisto: Opetusdata (100h) (yrityskäyttöön) | Donate Speech, Selected dataset: Training data (100h) (commercial use) | urn:nbn:fi:lb-2022060123 | http://urn.fi/urn:nbn:fi:lb-2022060130 | Yes | P | https://www.kielipankki.fi/aineistot/puhelahjat-commercial/ | {Helsingin yliopisto} | {University of Helsinki} | 2023 | 2023 | https://www.kielipankki.fi/lahjoita-puhetta/ | ||||||||||||||
| quantlang-uhlcs-korp | Kvantifiointi suomessa ja keskisen Volgan ja Kaman alueella puhuttavissa kielissä (UHLCS), Helsinki-Korp-versio | Quantifiers and Quantification in Finnish and Languages Spoken in the Central Volga–Kama Region (UHLCS), Helsinki Korp Version | Kvantifiointi suomessa ja keskisen Volgan ja Kaman alueella puhuttavissa kielissä (UHLCS), Helsinki-Korp-versio | Quantifiers and Quantification in Finnish and Languages Spoken in the Central Volga–Kama Region (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017030104 | Yes | T | No | Pirkko Suihkonen | Pirkko Suihkonen | 2016 | ||||||||||||||||||||
| Saamen kielen korpus | Puhutun saamen kielen korpus (Giellagas) | Giellagas Corpus of Spoken Saami Languages | Marko Jouste | Puhutun saamen kielen korpus (Giellagas) | Giellagas Corpus of Spoken Saami Languages | urn:nbn:fi:lb-2015060801 | Yes | P | |||||||||||||||||||||||
| sapu | Satakuntalaisuus puheessa -korpus | The Corpus of Sociolinguistic Variation in the Province of Satakunta | ![]() | Tommi Kurki | Satakuntalaisuus puheessa -korpus | The Corpus of Sociolinguistic Variation in the Province of Satakunta | urn:nbn:fi:lb-2022092121 | http://urn.fi/urn:nbn:fi:lb-2022092122 | No | P | No | Tommi Kurki; Kirsti Siitonen; Nobufumi Inaba | Tommi Kurki; Kirsti Siitonen; Nobufumi Inaba | ||||||||||||||||||
| sfnet-korp | SFNET-keskusteluryhmäkorpuksen Helsinki-Korp-versio | SFNET Corpus, Helsinki Korp Version | SFNET-keskusteluryhmäkorpuksen Helsinki-Korp-versio | SFNET Corpus, Helsinki Korp Version | urn:nbn:fi:lb-2017022803 | Yes | T | No | Tuuli Tuominen; Panu Kalliokoski; Antti Arppe; {CSC - Tieteen tietotekniikan keskus} | Tuuli Tuominen; Panu Kalliokoski; Antti Arppe; {CSC - IT Center for Science} | 2003 | ||||||||||||||||||||
| SignWiki | Viittomakielten SignWiki-hanke | The SignWiki Project of the Sign Languages in Finland | Leena Savolainen | www | Viittomakielten SignWiki-hanke | The SignWiki Project of the Sign Languages in Finland | No | P | www | ||||||||||||||||||||||
| skk-vrt | Suomalaisen kirjallisuuden klassikoita, VRT | Classics of Finnish Literature, VRT | ![]() | VRT | Petri Lauerma | Suomalaisen kirjallisuuden klassikoita, VRT | Classics of Finnish Literature, VRT | urn:nbn:fi:lb-2017121321 | http://ec.europa.eu/idabc/eupl.html | PUB EUPL v1.1 | Yes | T | http://urn.fi/urn:nbn:fi:lb-2021050703 | {Kotimaisten kielten keskus} | {Institute for the Languages of Finland} | ||||||||||||||||
| soap-ecorg-src | Corpus of American Soap Operas (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali | Corpus of American Soap Operas (Mark Davies, english-corpora.org) - Kielipankki version, source | B | FIN-CLARIN | Corpus of American Soap Operas (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali | Corpus of American Soap Operas (Mark Davies, english-corpora.org) - Kielipankki version, source | urn:nbn:fi:lb-2022112406 | RES-fi | T | Mark Davies | Mark Davies | 2011 | 2022 | ||||||||||||||||||
| stat-fi-en | Tilastokeskuksen suomi-englanti-käännösmuisti | Statistics Finland Translation Memory Finnish-English | Tilastokeskuksen suomi-englanti-käännösmuisti | Statistics Finland Translation Memory Finnish-English | urn:nbn:fi:lb-2017090405 | T | Yes | {Tilastokeskus} | {Statistics Finland} | ||||||||||||||||||||||
| stat-fi-sv | Tilastokeskuksen suomi-ruotsi-käännösmuisti | Statistics Finland's Finnish to Swedish Translation Memory | Tilastokeskuksen suomi-ruotsi-käännösmuisti | Statistics Finland's Finnish to Swedish Translation Memory | urn:nbn:fi:lb-2017090404 | T | Yes | {Tilastokeskus} | {Statistics Finland} | ||||||||||||||||||||||
| sus-fieldwork | Suomalais-Ugrilaisen Seuran kenttätyökorpus | The Finno-Ugrian Society Fieldwork Corpus | ![]() | Jack Rueter | Suomalais-Ugrilaisen Seuran kenttätyökorpus | The Finno-Ugrian Society Fieldwork Corpus | urn:nbn:fi:lb-2016092001 | http://creativecommons.org/licenses/by-nc/4.0/ | Yes | T | |||||||||||||||||||||
| Suvi | Suvi-verkkosanakirja | Suvi Finnish Sign Language Online Dictionary | Leena Savolainen | www | Suvi-verkkosanakirja | Suvi Finnish Sign Language Online Dictionary | urn:nbn:fi:lb-2014073039 | No | P | www | |||||||||||||||||||||
| TAITO | TAITO-hankkeen kirjalliset ja suulliset aineistot | Written and Oral Data of the TAITO-project | Marjo Vesalainen | www | TAITO-hankkeen kirjalliset ja suulliset aineistot | Written and Oral Data of the TAITO-project | urn:nbn:fi:lb-2014073035 | No | P | www | |||||||||||||||||||||
| tampuhe | Tampereen puhekielen pitkittäisaineisto | Longitudinal data of Tampere spoken language | ![]() | Liisa Mustanoja | Tampereen puhekielen pitkittäisaineisto | Longitudinal data of Tampere spoken language | urn:nbn:fi:lb-2022090821 | http://urn.fi/urn:nbn:fi:lb-2022090822 | No | P | No | Liisa Mustanoja | Liisa Mustanoja | ||||||||||||||||||
| tboneslim-src | T-Bone Slim -korpus, lähdemateriaali | T-Bone Slim Corpus, source | ![]() | A | Kirsti Salmi-Niklander | https://blogs.helsinki.fi/tboneslim | T-Bone Slim -korpus, lähdemateriaali | T-Bone Slim Corpus, source | urn:nbn:fi:lb-2022111621 | http://urn.fi/urn:nbn:fi:lb-2022111623 | No | T | No | http://urn.fi/urn:nbn:fi:lb-2022111622 | Kirsti Salmi-Niklander; Lotta Leiwo; muita | Kirsti Salmi-Niklander; Lotta Leiwo; others | https://blogs.helsinki.fi/tboneslim | ||||||||||||||
| testipiste | Testipisteaineisto | Testipiste Corpus | Janne Laitinen | Testipisteaineisto | Testipiste Corpus | urn:nbn:fi:lb-2017020701 | Yes | T | Janne Laitinen | Janne Laitinen | |||||||||||||||||||||
| Turjansaame | Puhutun ja kirjoitetun turjansaamen korpus | The Corpus of Spoken and Written Ter Saami | ![]() | Michael Riessler | Puhutun ja kirjoitetun turjansaamen korpus | The Corpus of Spoken and Written Ter Saami | urn:nbn:fi:lb-2015102002 | http://creativecommons.org/licenses/by/4.0/ | No | T | |||||||||||||||||||||
| tv-ecorg-src | The TV Corpus (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali | The TV Corpus (Mark Davies, english-corpora.org) - Kielipankki version, source | B | FIN-CLARIN | The TV Corpus (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali | The TV Corpus (Mark Davies, english-corpora.org) - Kielipankki version, source | urn:nbn:fi:lb-2022112411 | RES-fi | T | Mark Davies | Mark Davies | 2019 | 2022 | ||||||||||||||||||
| tver-1980 | Tverinkarjalan korpus 1957-1971 | The Corpus of Tver Karelian 1957-1971 | B | Marjatta Palander | Tverinkarjalan korpus 1957-1971 | The Corpus of Tver Karelian 1957-1971 | urn:nbn:fi:lb-2022053121 | No | P | Yes | Marjatta Palander; Milla Uusitupa; Helka Riionheimo | Marjatta Palander; Milla Uusitupa; Helka Riionheimo | |||||||||||||||||||
| tver-2020 | Tverinkarjalan korpus 2016-2019 | The Corpus of Tver Karelian 2016-2019 | B | Marjatta Palander | Tverinkarjalan korpus 2016-2019 | The Corpus of Tver Karelian 2016-2019 | urn:nbn:fi:lb-2022053122 | No | P | Yes | Marjatta Palander; Milla Uusitupa; Helka Riionheimo | Marjatta Palander; Milla Uusitupa; Helka Riionheimo | |||||||||||||||||||
| ume-saami-uhlcs-korp | Uumajansaamen korpuksen (UHLCS) Helsinki-Korp-versio | Ume Saami Corpus (UHLCS), Helsinki Korp Version Corpus | Uumajansaamen korpuksen (UHLCS) Helsinki-Korp-versio | Ume Saami Corpus (UHLCS), Helsinki Korp Version Corpus | urn:nbn:fi:lb-2017022809 | Yes | T | No | Olavi Korhonen | Olavi Korhonen | 2007 | ||||||||||||||||||||
| uralic-uhlcs-korp | Uralilaisia, turkkilaisia, indo-iranilaisia ja mongolikieliä sekä Siperian ja Kaukasian kieliä (UHLCS), Helsinki-Korp-versio | Uralic, Turkic, Indo-Iranian and Mongol languages; languages of Siberia and Caucasia (UHLCS), Helsinki Korp Version | Uralilaisia, turkkilaisia, indo-iranilaisia ja mongolikieliä sekä Siperian ja Kaukasian kieliä (UHLCS), Helsinki-Korp-versio | Uralic, Turkic, Indo-Iranian and Mongol languages; languages of Siberia and Caucasia (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022808 | Yes | T | No | Pirkko Suihkonen | Pirkko Suihkonen | 2007 | ||||||||||||||||||||
| uzbek-uhlcs-korp | Uzbekki-englanti sanakirjan (UHLCS) Helsinki-Korp-versio | Uzbek-English Dictionary (UHLCS), Helsinki Korp Version | Uzbekki-englanti sanakirjan (UHLCS) Helsinki-Korp-versio | Uzbek-English Dictionary (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022807 | Yes | T | No | Daniel Kimmage | Daniel Kimmage | 2007 | ||||||||||||||||||||
| VVKS | Virtuaalinen vanha kirjasuomi (VVKS) -kokoelman Kielipankin Korp-versio | Virtual Old Literary Finnish (VVKS) - Kielipankki Korp version | ![]() | Mari Siiroinen | Virtuaalinen vanha kirjasuomi (VVKS) -kokoelman Kielipankin Korp-versio | Virtual Old Literary Finnish (VVKS) - Kielipankki Korp version | urn:nbn:fi:lb-2017082101 | https://creativecommons.org/licenses/by-nc-nd/4.0/legalcode | Yes | T | No | {Helsingin yliopisto, suomen kielen, suomalais-ugrilaisten ja pohjoismaisten kielten ja kirjallisuuksien laitos} | {University of Helsinki, The Department of Finnish, Finno-Ugrian and Scandinavian Studies} | 2016 | |||||||||||||||||
| wikipedia-ecorg-src | The Wikipedia Corpus (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali | The Wikipedia Corpus (Mark Davies, english-corpora.org) - Kielipankki version, source | ![]() | B | FIN-CLARIN | The Wikipedia Corpus (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali | The Wikipedia Corpus (Mark Davies, english-corpora.org) - Kielipankki version, source | urn:nbn:fi:lb-2023032901 | http://urn.fi/urn:nbn:fi:lb-2023032903 | RES-fi | T | http://urn.fi/urn:nbn:fi:lb-2023032905 | Mark Davies | Mark Davies | 2023 | ||||||||||||||||
| wikipedia-fi-2017-korp | Suomenkielinen Wikipedia 2017, Korp | Finnish Wikipedia 2017, Korp | ![]() | Tatu Huovilainen | Suomenkielinen Wikipedia 2017, Korp | Finnish Wikipedia 2017, Korp | urn:nbn:fi:lb-2018060401 | https://creativecommons.org/licenses/by/4.0/legalcode | Yes | T | Yes | Tatu Huovilainen | Tatu Huovilainen | 2018 | |||||||||||||||||
| wordlists-uhlcs-korp | Sanaluettelokorpuksen (UHLCS) Helsinki-Korp-versio | Lists of Words Corpus (UHLCS), Helsinki Korp Version | Sanaluettelokorpuksen (UHLCS) Helsinki-Korp-versio | Lists of Words Corpus (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022814 | Yes | T | No | Pirkko Suihkonen | Pirkko Suihkonen | 2007 | ||||||||||||||||||||
| Yle-subtitle | Ylen ruututekstikorpus | The Finnish Broadcasting Company Corpus of Subtitles | Jukka Mäkisalo | Ylen ruututekstikorpus | The Finnish Broadcasting Company Corpus of Subtitles | urn:nbn:fi:lb-20140730134 | No | T | |||||||||||||||||||||||
| ylenews-fi-2019-2021-selko-korp | Ylen suomenkielisen uutisarkiston selkouutiset 2019-2021, Korp | Yle News Archive Easy-to-read Finnish 2019-2021, Korp | ![]() | A | Ylen suomenkielisen uutisarkiston selkouutiset 2019-2021, Korp | Yle News Archive Easy-to-read Finnish 2019-2021, Korp | urn:nbn:fi:lb-2022080401 | http://urn.fi/urn:nbn:fi:lb-2019121001 | ACA NC | T | http://urn.fi/urn:nbn:fi:lb-2021020901 | {Yleisradio} | {Yleisradio} | 2022 | |||||||||||||||||
| ylenews-fi-2019-2021-selko-s-korp | Ylen suomenkielisen uutisarkiston selkouutiset 2019-2021, sekoitettu, Korp | Yle News Archive Easy-to-read Finnish 2019-2021, scrambled, Korp | ![]() | A | Ylen suomenkielisen uutisarkiston selkouutiset 2019-2021, sekoitettu, Korp | Yle News Archive Easy-to-read Finnish 2019-2021, scrambled, Korp | urn:nbn:fi:lb-2022080403 | http://creativecommons.org/licenses/by/4.0/ | PUB CC BY | T | http://urn.fi/urn:nbn:fi:lb-2021020901 | {Yleisradio} | {Yleisradio} | 2022 |