Julkaistut kielivarat

acquis-ftb3-dl
JRC-Acquis-monikielisen rinnakkaiskorpuksen suomenkielinen osakorpus, ladattava versio
PUB
P
VRT
a
ai2d-rst-v1-1
PUB
P
a
JSON
a
JSON
a
Lataus
Tuomo Hiippala
aikakauslehtikorpus
Kotuksen aikakauslehtikorpus
c
c
b
VRT
a
Korp
Elisa Stenvall
Akkala
Puhutun ja kirjoitetun akkalansaamen korpus
a
a
a
VRT
a
Korp
Michael Riessler
amph-korp
Ajatella, miettiä, pohtia, harkita -korpuksen Helsinki-Korp-versio
c
c
TXT
a
VRT
a
Korp
Antti Arppe
CCMH
Muinaiskirkkoslaavin korpus
a
Lataus, Korp
Jouko Lindstedt
DIALUKI
DIALUKI - toisen ja vieraan kielen lukemisen ja kirjoittamisen diagnosointi
RES
R
c
a
TXT
a
VRT
a
Korp
Ari Huhta
dma-v2PUB
P
c
VRT
a
Korp
dma-wn-src
Digitaalisen muoto-opin arkiston sanaliput, lähdemateriaali
RES
R
c
a
PDF
a
Lataus
icon-question-circle
DSPCON2013-2015-korp
Aalto-yliopiston DSP-kurssin keskustelukorpus 2013-2015, Helsinki-Korp-version
c
c
TXT
a
VRT
a
Korp
Mikko Kurimo,
Seppo Enarvi
DSPCON2013-2015-lat
Aalto-yliopiston DSP-kurssin keskustelukorpus 2013-, Helsinki LAT -versio
c
a
TXT, WAV, TextGrid
a
VRT
a
Lat
Mikko Kurimo,
Seppo Enarvi
e-thesis-en-korp-v1-1
Helsingin yliopiston englanninkielinen E-thesis 1999-2016, Korp versio 1.1
PUB
P
a
c
PDF
a
VRT
a
Korp
eduskunta-v2-dl
a
a
MP4, WAV, TXT
a
WAV, ELAN, VRT
a
Lataus
icon-question-circle
eduskunta-v2-korp
a
c
TXT
a
WAV, ELAN, VRT
a
Korp
icon-question-circle
enets
a
a
MP4, WAV, ELAN
a
MP4, WAV, ELAN
a
Lataus, LAT, Korp
Olesya Khanina
english-uhlcs-korp
Englannin korpuksen (UHLCS) Helsinki-Korp-versio
c
c
TXT
a
VRT
a
Korp
ERME
ERME Ersän ja mokšan laajennettu korpus
c
b
XML
b
VRT
a
Korp
Jack Ruetermuuta
Ersä
Ersän puhekielen korpus
c
c
a
ELAN
a
Lat
Riho Grünthal
erzya-moksha-komi-uhlcs-korp
Ersän ja mokšan kirjallisuutta ja julkaisuja ja komisyrjäänin kirjallisuutta (UHLCS), Helsinki-Korp-versio
c
c
TXT
a
VRT
a
Korp
erzya-moksha-uhlcs-korp
Ersän ja mokšan sanaluettelokorpuksen (UHLCS) Helsinki-Korp-versio
c
c
TXT
a
VRT
a
Korp
estonian1-uhlcs-korp
Viron korpus 1:n (UHLCS) Helsinki-Korp-versio
c
c
TXT
a
VRT
a
Korp
estonian2-uhlcs-korp
Viron korpus 2:n (UHLCS) Helsinki-Korp-versio
c
c
TXT
a
VRT
a
Korp
fedidi
Murteita käsittelevien fennististen väitöskirjojen lähdetietokanta
a
c
TXT
c
TXT
a
Lataus
FinIntas
The FinINTAS Corpus of Spontaneous and Read-aloud Finnish Speech
a
c
wav + Praat
a
ELAN
a
Lat
Mietta Lennes
FINKA
Raja-Karjalan korpus
PUB
P
c
a
VRT
a
VRT
a
Korp
Marjatta Palander
finnish-bibles-uhlcs-korp
Suomen korpus (raamatut) (UHLCS), Helsinki-Korp-versio
c
c
TXT
a
VRT
a
Korp
finnish-literature-uhlcs-korp
Suomen korpus (kirjallisuutta) (UHLCS), Helsinki-Korp-versio
c
c
TXT
a
VRT
a
Korp
FinnTreeBank1-korp
Suomen kielen puupankki 1:n Helsinki-Korp-versio
PUB
P
c
c
TXT
a
VRT
a
Korp
ha-korp
Ha-kieliaineiston Helsinki-Korp-versio
PUB
P
c
c
TXT
a
VRT
a
Korp
Lotta Aunio
hanty-uhlcs-korp
Hantin korpus (pohjoishantin aineistot ja käännökset) (UHLCS), Helsinki-Korp-versio
c
c
TXT
a
VRT
a
Korp
HC
Helsinki Corpus of English Texts (1991)
c
c
XML
b
VRT
a
Korp
Terttu Nevalainen, Jukka TyrkköCoRD,OTA, muuta
helpuhe-2010txt
Helsingin puhekielen pitkittäiskorpus (2010-luvun tekstimuotoinen aineisto)
c
c
TextGrid
a
VRT
a
Korp
icon-question-circleHanna Lappalainen
helpuhe-v2-korp
Helsingin puhekielen pitkittäiskorpuksen (1970, 1990, 2010) Helsinki Korp versio 2
RES
R
c
a
a
a
Lat
icon-question-circleHanna Lappalainen
helpuhe-v2-lat
Helsingin puhekielen pitkittäiskorpuksen (1970, 1990, 2010) Helsinki LAT versio 2
RES
R
c
c
TextGrid
b
ELAN
a
Lat
Bicon-question-circleHanna Lappalainen
HS
Helsingin Sanomien arkisto -korpus
c
a
a
VRT
a
Korp
Jarkko Rahkonen
ingrian-uhlcs-korp
Inkeroisen korpuksen (UHLCS) Helsinki-Korp-versio
c
c
TXT
a
VRT
a
Korp
Inkerin murteet
Inkerin murteiden korpus
a
a
WORD-DOC, MP3, WAV
a
VRT, ELAN
a
Lat
Marjatta Palanderwww, muuta
Kiltinänsaame
Kirjoitetun kiltinänsaamen korpus
PUB
P
a
a
a
VRT
b
Korp
Mikael Riessler
Kiltinänsaame (UHLCS)
Kiltinänsaamen korpus (UHLCS)
c
c
PDF
b
PDF
a
Pirkko Suihkonen
komi-dl
a
b
MP4, WAV, ELAN
a
MP4, WAV, ELAN
a
Lataus, LAT
Niko Partanen
komi-uhlcs-korp
Komisyrjäänin korpuksen (UHLCS) Helsinki-Korp-versio
c
c
TXT
a
VRT
a
Korp
kra-korp
Keskiranskan korpuksen Helsinki-Korp-versio
c
c
TXT
a
VRT
a
Korp
latin-uhlcs-korp
Latinan korpuksen (UHLCS) Helsinki-Korp-versio
c
c
TXT
a
VRT
a
Korp
long-second
Long Second -korpus: Suomen kielen kehittyminen alakoulun valmistavalla luokalla
b
c
ELAN, MP4
a
VRT, ELAN
a
Lat, Korp
Maria Ahlholm
Lönnrot
Elias Lönnrotin kirjeenvaihto
PUB
P
c
a
XML
a
VRT
a
Korp
Kirsi Keravuoriwww
lude-uhlcs-korp
Lyydin korpuksen (UHLCS) Helsinki-Korp-versio
c
c
TXT
a
VRT
a
Korp
nenets-uhlcs-korp
Nenetsin korpuksen (UHLCS) Helsinki-Korp-versio
c
c
TXT
a
VRT
a
Korp
Nganasan
Nganasanin kielen puhekorpus
c
a
ELAN
a
VRT, ELAN
a
Lat
Larisa Leisiö
nlfcl
Kansalliskirjaston klassikkokirjasto - Kielipankki-versio
a
b
VRT
a
Korp
nmk-korp
Nimimaiseman muutos -korpuksen Helsinki Korp -versio
ACA
A
c
a
a
VRT
a
Korp
Elisa Stenvall
nmk-lat
Nimimaiseman muutos -korpuksen Helsinki LAT -versio
ACA
A
c
a
a
ELAN
a
LAT
Elisa Stenvall
NorDiga
Nordican digitaalinen arkisto
a
a
a
VRT
a
Korp
Jan Lindströmwww
north-saami-literature-uhlcs-korp
Pohjoissaamen korpus (kirjallisuutta) (UHLCS), Helsinki-Korp-versio
c
c
TXT
a
VRT
a
Korp
north-saami-report-uhlcs-korp
Pohjoissaamen korpuksen (Sámikultuvradoaibmagotti smiehttamush) (UHLCS) Helsinki-Korp-versio
c
c
TXT
a
VRT
a
Korp
nzadi
a
a
WAV, PDF, TXT
a
WAV, PDF, TXT
a
Lataus, LAT, Korp
Thera Marie Crane
ona
Oulun nauhoitearkisto
RES
R
c
b
a
ELAN
a
Lat
Niina Kunnas
opensub-fi-2017-korp
Suomenkielinen OpenSubtitles 2017, Kielipankki Korp-versio
PUB
P
c
c
VRT
b
VRT
a
Korp
Tatu Huovilainen
Opus ECB
Opus EKP -korpus
PUB
P
a
a
a
Jörg Tiedemann
Opus EU
Opus EU -korpus
PUB
P
a
a
a
Jörg Tiedemann
Opus Localization
Opus lokalisointi -korpus
a
a
a
Jörg Tiedemann
Opus Subtitles
Opus tekstitys -korpus
PUB
P
a
a
a
Jörg Tiedemann
oracc-2019-05-vrt
Open Richly Annotated Cuneiform Corpus, ladattava versio, toukokuu 2019
PUB
P
a
c
VRT
a
VRT
a
Lataus
icon-question-circleHeidi Jauhiainen
oulu-korp
Oulun korpuksen Helsinki-Korp-versio
c
c
TXT
a
VRT
a
Korp
pabivus-s-korp
Raamatun jakeita uralilaisille kielille, rinnakkaiskorpus, sekoitettu, Korp
PUB
P
a
c
TXT
a
VRT
a
Korp
Jack Rueter
parole-fi-korp
Suomen kielen Parole-korpuksen Helsinki-Korp-versio
c
c
TXT
a
VRT
a
Korp
PERSO
PERSO Databases for Finnish Speech Synthesis
c
c
TXT, WAV
a
ELAN
a
Lat
Martti Vainio, Heini Kallio
ProoF
ProoF - Maahanmuuttajien suomen kielen ääntäminen
a
a
wav + Praat
a
ELAN
a
Lat
Mietta Lennes
Prosodiakorpus
Suomen kielen prosodian variaation korpus
a
a
a
ELAN
a
Lat
Tommi Kurki, Tommi Nieminen
quantlang-uhlcs-korp
Kvantifiointi suomessa ja keskisen Volgan ja Kaman alueella puhuttavissa kielissä (UHLCS), Helsinki-Korp-versio
c
c
PDF
a
VRT
a
Korp
Saamen kielen korpus
Puhutun saamen kielen korpus (Giellagas)
c
c
a
ELAN
b
Lat
Marko Jouste
sfnet-korp
SFNET-keskusteluryhmäkorpuksen Helsinki-Korp-versio
c
c
TXT
a
VRT
a
Korp
SignWiki
a
a
a
ELAN
a
Lat
Leena Savolainenwww
stat-fi-en
Tilastokeskuksen suomi-englanti-käännösmuisti
c
TMX
b
TMX
a
Lataus
stat-fi-sv
Tilastokeskuksen suomi-ruotsi-käännösmuisti
c
TMX
b
TMX
a
Lataus
stt-fi-1992-2018-conllu-src
STT:n uutisarkisto 1992-2018, CoNLL-U, lähdemateriaali
RES
R
c
c
TXT
c
TXT
a
Lataus
Khalid Alnajjar
stt-fi-1992-2018-korp
STT:n uutisarkisto 1992-2018, Kielipankin Korp-versio
PUB
P
c
a
VRT
a
Korp
Olli Viitala
sus-fieldwork
Suomalais-Ugrilaisen Seuran kenttätyökorpus
PUB
P
c
a
a
VRT
a
Korp
Jack Rueter
Suvi
Suvi-verkkosanakirja
a
a
a
ELAN
a
Lat
Leena Savolainenwww
TAITO
TAITO-hankkeen kirjalliset ja suulliset aineistot
a
a
TXT
a
ELAN
a
Lat
Marjo Vesalainenwww
testipiste
Testipisteaineisto
c
a
VRT
a
Korp
Janne Laitinen
Turjansaame
Puhutun ja kirjoitetun turjansaamen korpus
PUB
P
a
a
TXT
a
VRT
a
Korp
Michael Riessler
ume-saami-uhlcs-korp
Uumajansaamen korpuksen (UHLCS) Helsinki-Korp-versio
c
c
TXT
a
VRT
a
Korp
uralic-uhlcs-korp
Uralilaisia, turkkilaisia, indo-iranilaisia ja mongolikieliä sekä Siperian ja Kaukasian kieliä (UHLCS), Helsinki-Korp-versio
c
c
TXT
a
VRT
a
Korp
uzbek-uhlcs-korp
Uzbekki-englanti sanakirjan (UHLCS) Helsinki-Korp-versio
c
c
TXT
a
VRT
a
Korp
VVKS
Virtuaalinen vanha kirjasuomi (VVKS) -kokoelman Kielipankin Korp-versio
PUB
P
c
a
a
VRT
a
Korp
Mari Siiroinen
wikipedia-fi-2017-korp
Suomenkielinen Wikipedia 2017, Korp
PUB
P
c
c
VRT
b
VRT
a
Korp
Tatu Huovilainen
wordlists-uhlcs-korp
Sanaluettelokorpuksen (UHLCS) Helsinki-Korp-versio
c
c
TXT
a
VRT
a
Korp
Yle-subtitle
Ylen ruututekstikorpus
a
a
TXT
a
VRT
a
Korp
Jukka Mäkisalo
ylenews-fi-2011-2018-s-vrt
Ylen suomenkielinen uutisarkisto 2011-2018, sekoitettu, VRT
PUB
P
c
c
TXT
a
VRT
a
Lataus
icon-question-circle
ylenews-fi-2011-2018-selko-s-vrt
Ylen suomenkielisen uutisarkiston selkouutiset 2011-2018, sekoitettu, VRT
PUB
P
c
c
TXT
a
VRT
a
Lataus
icon-question-circle
ylenews-fi-2011-2018-selko-vrt
Ylen suomenkielisen uutisarkiston selkouutiset 2011-2018, VRT
ACA
A
c
c
TXT
a
VRT
a
Lataus
icon-question-circle
ylenews-fi-2011-2018-vrt
Ylen suomenkielinen uutisarkisto 2011-2018, VRT
ACA
A
c
c
TXT
a
VRT
a
Lataus
icon-question-circle
ylenews-sv-2012-2018-s-vrt
Ylen ruotsinkielinen uutisarkisto 2012-2018, sekoitettu, VRT
PUB
P
c
c
JSON
a
VRT
a
Lataus
icon-question-circleMikael Hindsberg
ylenews-sv-2012-2018-vrt
Ylen ruotsinkielinen uutisarkisto 2012-2018, VRT
ACA
A
c
c
JSON
a
VRT
a
Lataus
icon-question-circleMikael Hindsberg