Wanca 2016

In English


Saatavilla olevat versiot

LyhenneNimi ja kuvailutiedotLisenssiSijaintiViiteAineistoryhmä ja ohjeHae käyttöoikeuttaJulkaisuvuosiTukitaso
LyhenneNimi ja kuvailutiedotLisenssiSijaintiViiteAineistoryhmä ja ohjeHae käyttöoikeuttaJulkaisuvuosiTukitaso

Tulossa olevat versiot

Nämä aineistoversiot eivät vielä ole saatavilla Kielipankin kautta.

LyhenneNimi ja kuvailutiedotLisenssiMuotoTukitasoYhteyshenkilöSijaintiAineistoryhmä ja ohjeMuu tieto
LyhenneNimi ja kuvailutiedotLisenssiMuotoTukitasoYhteyshenkilöSijaintiAineistoryhmä ja ohjeMuu tieto

Tietoa aineistosta

Wanca 2016 is a collection of web corpora in small Uralic languages. The collection is composed of 29 sentence corpora in different languages. The corpora have been collected from the Internet using the automated system developed in the Finno-Ugric Languages and the Internet project (SUKI) supported by the Kone foundation from their Language Programme 2012-2016. The sentences have been extracted from the pages found while harvesting with Heritrix and the language of each sentence has been identified with MultiLi using HeLI as the identification method. Each sentence has a link to the original page it was found in, but it is possible that some of the links stop working. In that case we recommend searching for the page in the Internet Archive Wayback machine https://archive.org/web/.

More information on Wanca: http://www.suki.ling.helsinki.fi/wanca

Lisenssi ja pääsy aineistoon

  • Tämän aineiston versiot ovat saatavilla julkisesti (PUB).
  • Lisenssikuvaketta napauttamalla näet tarkan aineistokohtaisen lisenssin.

Lisädokumentaatio

The languages in Wanca 2016 are:

ISO 639-3 Name of language
fit Tornedalen Finnish (meänkieli)
fkv Kven (kvääni)
izh Ingrian (ižoran keel)
kca Khanty (ханты ясанг)
koi Komi-Permyak (перем коми кыв)
kpv Komi-Zyrian (Коми кыв)
krl Karelian (karjal)
liv Liv (līvõ kēļ)
lud Ludian (lüüdin kiel’)
mdf Moksha (мокшень)
mhr Eastern and Meadow Mari (марий йылме)
mns Mansi (мāньси лāтыӈ)
mrj Western or Hill Mari (Кырык мары)
myv Erzya (эрзянь)
nio Nganasan (ня”)
olo Livvi (Olonets / livvin karjal)
sjd Kildin Sami (Кӣллт са̄мь кӣлл)
sjk Kemi Sami (samääškiela)
sju Ume Sami (uumajanlappi)
sma Southern Sami (åarjel-saemien)
sme Northern Sami (davvisámi, davvisámegiella)
smj Lule Sami (julevsábme)
smn Inari Sami (anarâškielâ)
sms Skolt Sami (sää´mǩiõll)
udm Udmurt (удмурт кыл)
vep Veps (vepsän kel’)
vot Votic (vad̕d̕a ceeli)
vro Võro (võro kiil)
yrk Nenets (ненэцяʼ вада)

 


Tämän sivun pysyvä tunniste: http://urn.fi/urn:nbn:fi:lb-2025112609

Viimeksi muokattu 2025-11-27