UDPipe

UDPipe is a trainable pipeline for tokenization, tagging, lemmatization and dependency parsing of CoNLL-U files. UDPipe is language-agnostic and can be trained given annotated data in CoNLL-U format. Trained models are provided for nearly all UD treebanks. UDPipe is available as a binary for Linux/Windows/OS X, as a library for C++, Python, Perl, Java, C#, and as a web service. Third-party R CRAN package also exists.

UDPipe is a free software distributed under the Mozilla Public License 2.0 and the linguistic models are free for non-commercial use and distributed under the CC BY-NC-SA license, although for some models the original data used to create the model may impose additional licensing conditions. UDPipe is versioned using Semantic Versioning.

Copyright 2017 by the Institute of Formal and Applied Linguistics, Faculty of Mathematics and Physics, Charles University, Czech Republic.

Kielipankki version:  
UDPipe Kielipankki version
icon-info-circle Metadata and license
Access to Puhti
Source version:  
UDPipe
icon-info-circle Metadata and license
Access to GitHub
Look for all versions of this tool in META-SHARE  

For more information on this tool have a look at the UDPipe User’s manual

 

More information on the Kielipankki version:

Using UDPipe on CSC’s servers requires a CSC user account: https://research.csc.fi/accounts-and-projects

UDPipe is installed in CSC’s computing environment (invoke with: module load udpipe) in the following configuration:
Software: UDPipe 1.2.0
Models: 2.3-181115

UDPipe was compiled and installed from Source without local modifications. Please refer to the user’s manual.

The tool was installed using Ansible scripts that can be found here: https://github.com/CSCfi/Kielipankki-palvelut/tree/Dec2018/commandline/roles/udpipe


This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2024021901

Finnish Dependency Parsing Pipeline

Kielipankki version:  
Turku Dependency Parser Pipeline, Kielipankki version (TDPP-LBF)
icon-info-circle Metadata and license
Access to GitHub
TurkuNLP Finnish Dependency Parser:  
Finnish dependency parser developed by TurkuNLP (TDPP)
icon-info-circle Metadata and license
Access to GitHub
Look for all versions of this tool in META-SHARE  

The Turku Dependency Parser Pipeline, Kielipankki version (TDPP-LBF) is a version of the open source dependency parsing pipeline developed by the University of Turku NLP group for analyzing Finnish text, adapted by Kielipankki – the Language Bank of Finland.

For further information on the source version please visit the project’s website.

 

On Kielipankki’s GitHub repository you can find VRT tools adapted from the original pipeline (vrt-tdp-…):

  • vrt-tdp-alpha-fillup
  • vrt-tdp-alpha-lookup
  • vrt-tdp-alpha-marmot
  • vrt-tdp-alpha-parse

 


This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2024021503

DigiTala L2 (2019–2023)

In English

Aineiston viimeisimmät versiot:  
DigiTala: lukioissa ja yliopistossa kerätty S2-aineisto, syksy 2021
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Aineisto on pian saatavilla
DigiTala: lukioissa kerätty S2-aineisto, kevät 2021
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Aineisto on pian saatavilla
DigiTala: aikuisoppijoilta kerätty ruotsi toisena kielenä -aineisto, kevät 2023
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Aineisto on pian saatavilla
Etsi muut saatavilla olevat versiot  

Lisätiedot löytyvät DigiTalan aineistoryhmäsivulta.


 Viimeksi päivitetty: 16.02.2024

Tämän sivun pysyvä tunniste: http://urn.fi/urn:nbn:fi:lb-2024021506

DigiTala L2 (2019–2023)

Suomeksi

Current versions of this resource:
DigiTala: L2 Finnish data from upper secondary schools and university, autumn 2021
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
The resource will be available soon
DigiTala: L2 Finnish data from upper secondary schools, spring 2021
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
The resource will be available soon
DigiTala: L2 Swedish data from adult language learners, spring 2023
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
The resource will be available soon
Look for other versions of this resource

For further information please see the DigiTala resource group page


Last updated: 16.02.2024

This page has a persistent identifier: http://urn.fi/urn:nbn:fi:lb-2024021505

DigiTala (2019–2023)

In English

Aineiston viimeisimmät versiot:  
DigiTala: lukioissa ja yliopistossa kerätty S2-aineisto, syksy 2021
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Aineisto on pian saatavilla
DigiTala: lukioissa kerätty S2-aineisto, kevät 2021
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Aineisto on pian saatavilla
DigiTala: aikuisoppijoilta kerätty ruotsi toisena kielenä -aineisto, kevät 2023
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Aineisto on pian saatavilla
DigiTalan YKI-aineisto
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Aineisto on pian saatavilla
Etsi muut saatavilla olevat versiot  

Aineiston sisältö

Tämä resurssi sisältää näytteitä L2-suomea ja L2-ruotsia puhuvilta henkilöiltä, transkriptioita, ihmisten antamia arvioita, oppijoiden vastauksia testin jälkeisiin kyselyihin ja arvioijien vastauksia arvioinnin jälkeisiin kyselyihin. Aineisto on kerätty DigiTala-tutkimushankkeessa (2019-2023) suomea tai ruotsia toisena kielenä oppivilta aikuisopiskelijoilta.

DigiTala-tutkimushankkeen (2019-2023) päätavoitteena on kehittää digitaalinen työkalu, joka käyttää automaattista puheentunnistusta ja automaattista pisteytystä suomen- ja ruotsinkielisten oppijoiden suullisen kielitaidon arviointiin. Työkalu antaa myös automaattista palautetta oppijoiden puhesuorituksista. Hankkeessa kehitetyn digitaalisen työkalun tarkoituksena on mahdollistaa suullisen kielitaidon arviointi korkean tason kielikokeissa. Lisäksi oppilaat voivat harjoitella ääntämistä ja puheen tuottamista vierailla kielillä itsenäisesti koulun ulkopuolella tai ilman opettajan ohjausta kielitunneilla.

Hankkeen aikana kerättiin aineistoa suomea tai ruotsia toisena kielenä opiskelevilta lukiolaisilta ja yliopisto-opiskelijoilta. Lisäksi hankkeessa hyödynnettiin suomen ja ruotsin yleisten kielitutkintojen (Yleiset kielitutkinnot, YKI) puheaineistoa.

Hanke on Suomen Akatemian rahoittama 2019-2023, ja siinä yhdistyvät Helsingin yliopiston (apurahanumero 322619), Aalto-yliopiston (apurahanumero 322625) ja Jyväskylän yliopiston (apurahanumero 322965) asiantuntemus puheen ja kielen prosessoinnissa, kielikasvatuksessa ja fonetiikassa. Nykyinen hanke perustuu pilottihankkeen aikana saatuihin kokemuksiin, ks. DigiTala (2015-2017).

Lisätietoja sisällöstä ja eri korpusversioita koskevista ehdoista ja edellytyksistä löytyy kunkin aineistoversion kuvailutiedoista.

Lisätiedot

DigiTala-hankkeen (2019-2023) verkkosivusto

DigiTala-hankkeen materiaaleja: Tehtävät, kyselylomakkeet ja arviointikriteerit


 Viimeksi päivitetty: 31.01.2024

Tämän sivun pysyvä tunniste: http://urn.fi/urn:nbn:fi:lb-2024013002

DigiTala (2019–2023)

Suomeksi

Current versions of this resource:
DigiTala: L2 Finnish data from upper secondary schools and university, autumn 2021
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
The resource will be available soon
DigiTala: L2 Finnish data from upper secondary schools, spring 2021
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
The resource will be available soon
DigiTala: L2 Swedish data from adult language learners, spring 2023
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
The resource will be available soon
DigiTala’s YKI data
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
The resource will be available soon
Look for other versions of this resource

Corpus contents

This resource includes speech samples from L2 Finnish speakers and L2 Finland Swedish speakers, transcripts, human ratings, the learners’ responses to post-test surveys and the raters’ responses to post-rating surveys. The data was collected by the DigiTala research project (2019–2023) from adult learners of Finnish or Swedish as a second language.

The main goal for DigiTala (2019–2023) research project is to develop a digital tool that uses automatic speech recognition and automatic scoring to assess L2 Finnish and Swedish learners’ oral skills. The tool also provides automated feedback on learners’ speaking performances. The purpose of the digital tool developed in the project is to make assessment of oral language skills possible in high-stakes language tests. Furthermore, students can practice their pronunciation and speech production in foreign languages independently outside the school or without the teacher’s guidance at language classes.

During the project, material was collected from upper secondary school students and university students learning Finnish or Swedish as a second language. In addition, the project made use of the speech material from Finnish and Swedish general language tests (Yleiset kielitutkinnot, YKI).

The project is funded by the Academy of Finland 2019–2023, and combines expertise in speech and language processing, language education and phonetics at the University of Helsinki (grant number 322619), Aalto University (grant number 322625) and the University of Jyväskylä (grant number 322965). The current project builds on lessons learned during a pilot project, see DigiTala (2015–2017).

Further details about the content and the terms and conditions regarding the different corpus versions are available in the corresponding metadata records.

Further information

Website of the DigiTala research project (2019–2023)

DigiTala project resources: Tasks, surveys and rating criteria


Last updated: 31.01.2024

This page has a persistent identifier: http://urn.fi/urn:nbn:fi:lb-2024013001

T-Bone Slim -korpus

In English

Aineiston viimeisimmät versiot:  
T-Bone Slim -korpus, lähdemateriaali
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Aineisto on pian saatavilla
Etsi muut saatavilla olevat versiot  

Aineiston sisältö

T-Bone Slim -korpus käsittää amerikansuomalaisen kirjailijan T-Bone Slimin (Matti V. Huhta, 1882-1942) sanomalehdissä julkaisemat kolumnit, runot ja käsikirjoitukset sekä pamfletin ”Starving Amidst Too Much” (1923). Tekstejä on kaikkiaan n. 1500-2000 kpl. Yksittäisten tekstien sanamäärä vaihtelee n. 500-2000 välillä. Aineistoon sisältyvät myös tekstien julkaisutiedot ja muut taustatiedot taulukkomuodossa.

T-Bone Slim julkaisi tekstinsä IWW (Industrial Workers of the World)-työväenliikkeen lehdissä. Alkuperäisiä englanninkielisiä tekstejä julkaistiin seuraavissa lehdissä:
– Industrial Worker 1921–1942
– Solidarity 1921
– Truth 1921–1923
– Industrial Solidarity 1921–1932
– Industrial Pioneer 1925–1926; 1929
– One Big Union Monthly 1938 (1920?)

Suomenkielisiä käännöksiä tai alun perin suomeksi kirjoitettuja tekstejä julkaistiin seuraavissa lehdissä:
– Amerikan Sanomat 1903 (nimellä Mathew Houghton)
– Industrialisti 1921
– Tie Vapauteen 1923

Aineisto on peräisin seuraavista kirjastoista ja arkistoista: Kansalliskirjasto; University of Michigan, Labadie Collection; Newberry Library, Minnesota Historical Society, Minnesota Digital Newspaper Hub; Walter Reuther Library, Wayne State University; Westmoreland family archives.

Aineistokokonaisuus liittyy Koneen Säätiön rahoittamaan hankkeeseen ”T-Bone Slim and the transnational poetics of the migrant left in North America” (2022-2023).

Hankkeen kotisivut: https://blogs.helsinki.fi/tboneslim.

Tarkemmat aineistokohtaiset käyttöehdot löytyvät kunkin aineistoversion kuvailutiedoista.


 Viimeksi päivitetty: 16.01.2024

Tämän sivun pysyvä tunniste: http://urn.fi/urn:nbn:fi:lb-2024011205

T-Bone Slim Corpus

Suomeksi

Current versions of this resource:
T-Bone Slim Corpus, source
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
The corpus will be available soon
Look for other versions of this resource

Corpus contents

The T-Bone Slim corpus consists of columns, poems and manuscripts by the Finnish-American writer T-Bone Slim (Matti V. Huhta, 1882-1942), published in newspapers, as well as the pamphlet ”Starving Amidst Too Much” (1923). The total number of texts is around 1500-2000, with the number of words in individual texts varying between 500 and 2000. The database also includes publication details and other background information on the texts in tabular form.

T-Bone Slim published his texts in the labour movement’s newspapers of the IWW (Industrial Workers of the World). Original texts in English were published in the following magazines:
– Industrial Worker 1921–1942
– Solidarity 1921
– Truth 1921–1923
– Industrial Solidarity 1921–1932
– Industrial Pioneer 1925–1926; 1929
– One Big Union Monthly 1938 (1920?)

Finnish translations or texts originally written in Finnish were published in the following journals:
– Amerikan Sanomat 1903 (nimellä Mathew Houghton)
– Industrialisti 1921
– Tie Vapauteen 1923

The material comes from the following libraries and archives: the University of Michigan, Labadie Collection; Newberry Library, Minnesota Historical Society, Minnesota Digital Newspaper Hub; Walter Reuther Library, Wayne State University; Westmoreland family archives.

The collection is part of the Kone Foundation funded project ”T-Bone Slim and the transnational poetics of the migrant left in North America” (2022-2023).
Project homepage: https://blogs.helsinki.fi/tboneslim

Further details about the content and the terms and conditions regarding the different corpus versions are available in the corresponding metadata records.


Last updated: 16.01.2024

This page has a persistent identifier: http://urn.fi/urn:nbn:fi:lb-2024011204

finnsurveytext

In English

Tämän R-paketin tarkoituksena on tarjota yhteiskuntatieteiden tutkijoille hyödyllisiä ja käyttäjäystävällisiä työkaluja, joiden avulla he voivat analysoida ja ymmärtää kyselytutkimuksissaan avoimiin kysymyksiin annettuja vastauksia. 

R on tilastolaskentaan ja datan kuvantamiseen kehitetty ohjelmointikieli. R-pakettien asentaminen ja käyttö edellyttää, että R-ympäristö (tai esimerkiksi RStudio-sovellus) on asennettuna. Jos käytät CSC:n laskentaympäristöä, dokumentaatio ja ohjeita löytyy esim. https://docs.csc.fi/apps/r-env/.

Paketti on saatavilla MIT-lisenssillä. Katso lisenssin englanninkielinen teksti kokonaisuudessaan täältä.

Lisätietoja löytyy paketin kotisivulta.

Viimeisin versio:  
finnsurveytext
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Lataa työkalu
Etsi muita tämän työkalun versioita META-SHAREsta  

Yksityiskohtaiset tiedot kunkin version sisällöstä, käyttöoikeuksista ja lisensseistä löytyvät META-SHAREn metatietueesta.  

Tämän sivun pysyvä tunniste: http://urn.fi/urn:nbn:fi:lb-2024011203

finnsurveytext

Suomeksi

This R package aims to provide a useful and user friendly set of tools for social science researchers to be able to analyse and understand responses to open-ended questions within their surveys.  

R is a programming language for statistical computing and data visualization. To install and use an R package, you first need to have an R installation (or, e.g., the RStudio application). If you like to use CSC computing environment, please see https://docs.csc.fi/apps/r-env/ for further documentation and instructions.

The package is available under the MIT license. Please see the full license text here.

For further information please visit the package’s website.

Latest versions/subcorpora:  
finnsurveytext
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Download the tool
Look for all versions in META-SHARE  

Detailed information on the content of each version, user rights and licenses can be found from it’s specific metadata record in META-SHARE.  

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2024011202

Tieteen termipankki

In English

Tieteen termipankki (The Helsinki Term Bank for the Arts and Sciences, HTB) on monitieteinen hanke, jonka tavoitteena on koota kaikkien Suomessa harjoitettavien tieteenalojen pysyvä termitietokanta. Termipankille on luotu Semantic MediaWiki -alusta, joka toimii yhteistyöympäristönä. Kuka tahansa voi vapaasti hyödyntää alustaa ja osallistua termejä koskevaan keskusteluun.

Tieteen termipankki
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Viittausohjeet
Avaa verkkopalvelu

Kuvailutiedoissa on lisätietoa termipankin sisällöstä ja käyttöehdoista.

 


Tämän sivun pysyvä tunniste: urn:nbn:fi:lb-2024010821

Jouluevankeliumi tekstistä puheeksi neljällä uralilaisella kielellä

In English

Aineiston viimeisimmät versiot:  
Jouluevankeliumi tekstistä puheeksi neljällä uralilaisella kielellä, Korp
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Avaa aineisto Korp-palvelussa icon-question-circle
Jouluevankeliumi tekstistä puheeksi neljällä uralilaisella kielellä, lähdemateriaali
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Lataa aineisto
Etsi muut saatavilla olevat versiot  

Aineiston sisältö

Aineisto sisältää PaBiVUS-korpuksesta otetun jouluevankeliumin Luuk. 2:1–20 tekstimuodossa sekä tekstistä puheeksi neljällä kielellä: komi-syrjääni (kpv), ersä (myv), karjala (krl) ja aunuksenkarjala eli livvinkarjala (olo).

Tarkemmat tiedot sisällöstä ja aineistokohtaiset käyttöehdot löytyvät kunkin aineistoversion kuvailutiedoista.


 Viimeksi päivitetty: 22.11.2023

Tämän sivun pysyvä tunniste: http://urn.fi/urn:nbn:fi:lb-2023110606

Christmas Gospel text-to-speech in four Uralic languages

Suomeksi

Current versions of this resource:
Christmas Gospel text-to-speech in four Uralic languages, Korp
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Select the corpus in Korp icon-question-circle
Christmas Gospel text-to-speech in four Uralic languages, source
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Download the resource
Look for other versions of this resource

Resource contents

This resource contains text and text-to-speech in four languages pertaining to the Finnish Christmas Gospel verses Luke 2. 1–20. The four languages include Komi-Zyrian (kpv), Erzya (myv), Karelian (krl) and Olonets-Karelian (olo, aka Livvi), whose texts are all included in the PaBiVUS corpus (LUK.2.1–20).

Further details about the content and the terms and conditions regarding the different corpus versions are available in the corresponding metadata records.


Last updated: 22.11.2023

This page has a persistent identifier: http://urn.fi/urn:nbn:fi:lb-2023110605

Pavlik Morozov, rinnakkaiskorpus (morozov-par)

In English

Aineiston viimeisimmät versiot:
Pavlik Morozov, rinnakkaiskorpus, Korp
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Aineisto on pian saatavilla Korpissa icon-question-circle
Etsi muut saatavilla olevat versiot

Aineiston sisältö

Turun yliopiston volgankielten tutkimusyksikön rinnakkaistekstikorpus sisältää Vitali Gubarevin nuorisoromaanin Pavlik Morozov (1947) käännökset, jotka on järjestetty vastaaviin lauseisiin. Korpuksessa on neljätoista käännöstä ja alkuperäinen venäjänkielinen teksti, yhteensä viisitoista tekstiä.

Lisätietoja korpuksesta löytyvät täältä: Ohjeet Pavlic Morozovin korpuksen käyttäjälle (englanniksi)

Tarkemmat aineistokohtaiset käyttöehdot löytyvät kunkin aineistoversion kuvailutiedoista.


Viimeksi päivitetty: 05.09.2023

Tämän sivun pysyvä tunniste: http://urn.fi/urn:nbn:fi:lb-2023082107

Pavlik Morozov, parallel corpus (morozov-par)

Suomeksi

Current versions of this resource:
Pavlik Morozov, parallel corpus, Korp
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Select the corpus in Korp icon-question-circle
Look for other versions of this resource

Corpus contents

The parallel text corpus of the Research Unit for Volgaic Languages at the University of Turku includes translations of a youth novel, Pavlik Morozov (1947) by Vitali Gubarev, organized in equivalent sentences. The corpus has fourteen translations and the original Russian text, altogether fifteen texts.

For more information about the corpus, see Instructions for the user of Pavlic Morozov corpus

Further details about the content and the terms and conditions regarding the different corpus versions are available in the corresponding metadata records.


Last updated: 05.09.2023

This page has a persistent identifier: http://urn.fi/urn:nbn:fi:lb-2023082106

Follow-up Study of Dialects of Finnish

Suomeksi

Current versions of this resource:
Follow-up Study of Dialects of Finnish, downloadable version
icon-info-circle Metadata and license
icon-exclamation-triangle PRIV: This resource contains personal data, see license.
icon-quote-right Attribution instructions
Apply for access rights

This version will soon be available for download.
Follow-up Study of Dialects of Finnish
icon-info-circle Metadata and license
icon-exclamation-triangle PRIV: This resource contains personal data, see license.
icon-quote-right Attribution instructions


Since the LAT platform was taken out of use in late 2020, this version is no longer available. However, the same content will be available for download (see above).
Look for other versions of this resource

Resource contents

The follow-up study of Finnish dialects was started in 1989. It is a sociolinguistic and dialectological longitudinal study which is carried out in cooperation with the universities. The goal of the project has been to study the development of regional dialects in real time in 10 rural municipalities at the interval of 10 years. The municipalities chosen represent the traditional main dialect groups of Finnish. In each town, altogether 15 speakers have been used as informants. The external variables used in the study include age and sex: in each town, speakers of three generations have been studied (O = old, M = middle-aged, Y = young), both men and women. The data have been collected by using the traditional dialect interview method, and the study has focused on phonological and morphological features. Reports of ten sub-studies and a final report of the first round have been completed.

The second round of the project was started in 1999 and completed in 2007. Eight of the sub-studies have been completed, one of them as a form of the dissertation (Kurki 2005). During the second round, other types of data collected in addition to interviews. The part of the sub-studies focus on other than traditional sociolinguistic variables.

Further details about the content and the terms and conditions regarding the different corpus versions are available in the corresponding metadata records.



Last updated: 30.8.2023

This page has a persistent identifier: http://urn.fi/urn:nbn:fi:lb-2023082101

Tetûrev: Ympäristö- ja luonnontieto 3. luokalle (tetiurev-nat-sci)

In English

Aineiston viimeisimmät versiot:
Tetûrev: Ympäristö- ja luonnontieto 3. luokalle, ensimmäinen osa, Korp
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Aineisto on pian saatavilla Korpissa icon-question-circle
Tetûrev: Ympäristö- ja luonnontieto 3. luokalle, ensimmäinen osa, VRT
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Aineisto on pian ladatavissa
Etsi muut saatavilla olevat versiot

Aineiston sisältö

Aineisto sisältää ensimmäisen osan Vladimir Alekseevič Tetûrevin (Владимир Алексеевич Тетюрев) kirjoittamasta oppikirjasta ”Ympäristö ja luonnontieto 3. luokalle”. Rinnakkaisteksti on saatavilla Erzyassa ja Moksassa.

Tarkemmat aineistokohtaiset käyttöehdot löytyvät kunkin aineistoversion kuvailutiedoista.


Viimeksi päivitetty: 03.08.2023

Tämän sivun pysyvä tunniste: http://urn.fi/urn:nbn:fi:lb-2023080302

Tetiurev: Environment and Natural Science for 3rd grade (tetiurev-nat-sci)

Suomeksi

Current versions of this resource:
Tetiurev: Environment and Natural Science for 3rd grade, part one, Korp
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
The corpus will be available in Korp soon icon-question-circle
Tetiurev: Environment and Natural Science for 3rd grade, part one, VRT
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
The corpus will be available for download soon
Look for other versions of this resource

Corpus contents

The resource contains the first part of a study book called ”Environment and Natural Science for 3rd grade”, written by Vladimir Alekseevič Tetûrev (Владимир Алексеевич Тетюрев). The parallel text is available in Erzya and in Moksha.

Further details about the content and the terms and conditions regarding the different corpus versions are available in the corresponding metadata records.


Last updated: 02.08.2023

This page has a persistent identifier: http://urn.fi/urn:nbn:fi:lb-2023042425

Suomi, eilen ja tänään (suomiejt-par)

In English

Aineiston viimeisimmät versiot:
Suomi, eilen ja tänään -rinnakkaiskorpus, Korp-versio
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Aineisto on pian saatavilla Korpissa icon-question-circle
Suomi, eilen ja tänään -rinnakkaiskorpus, VRT
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Aineisto on pian ladatavissa
Etsi muut saatavilla olevat versiot

Aineiston sisältö

Kaisa Häkkinen ja Seppo Zetterberg kirjoittivat käsikirjoituksen ”Suomi eilen ja tänään” käännettäväksi lukuisille suomalais-ugrilaisten vähemmistökielille Venäjällä. M.A. Castrénin seura tilasi 1990-luvun lopulla tämän käsikirjoituksen tietopaketiksi vähemmistökielistä tiedotusta varten Suomen historiasta, kulttuurista ja valtiollisuudesta vuonna 1995. Yksi hankkeen ideoista oli tarjota sellaista primääritietoa, jota ei ollut saatavilla minkään muun kanavan kautta – antaa vähemmistökielille mielekästä käyttöä uuden tiedon lähteenä. Niinpä käännökset tehtiin vähemmistökielille komi-zyriiniksi, udmurtiksi, niittymariksi, erzyaksi ja moksaksi. Kääntäjät olivat kielitieteilijöitä, jotka olivat viettäneet aikaa Suomessa ja joilla oli siten myös omakohtaista kokemusta Suomesta. Kaikki käännökset, myös venäjänkielinen käännös, julkaistiin Venäjällä vuonna 1997.

Tarkemmat aineistokohtaiset käyttöehdot löytyvät kunkin aineistoversion kuvailutiedoista.


Viimeksi päivitetty: 03.08.2023

Tämän sivun pysyvä tunniste: http://urn.fi/urn:nbn:fi:lb-2023080301

Finland, Yesterday and Today (suomiejt-par)

Suomeksi

Current versions of this resource:
Finland, Yesterday and Today, parallel corpus, Korp Version
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
The corpus will be available in Korp soon icon-question-circle
Finland, Yesterday and Today, parallel corpus, VRT
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
The corpus will be available for download soon
Look for other versions of this resource

Corpus contents

Suomi eilen ja tänään ’Finland, Yesterday and Today’ was written as a manuscript by Kaisa Häkkinen and Seppo Zetterberg for translation into numerous minority Finno-Ugric languages in Russia. In the late 1990s, the M.A. Castrén Society commissioned this manuscript as an information package for providing minority-language information on Finnish history, culture and statehood in 1995. One of the ideas behind this project was to provide primary information that was not available through any other channel – give minority language a meaningful use as a source of new information. Thus, translations were made into the minority languages Komi-Zyrian, Udmurt, Meadow Mari, Erzya and Moksha. The translators were linguists who had spent time in Finland and therefore had personal experience of Finland as well. All of the translations including a Russian translation were published in Russia in 1997.

Further details about the content and the terms and conditions regarding the different corpus versions are available in the corresponding metadata records.


Last updated: 02.08.2023

This page has a persistent identifier: http://urn.fi/urn:nbn:fi:lb-2023041805

Search the Language Bank Portal:
Tanja Säily
Researcher of the Month: Tanja Säily

 

Upcoming events


Contact

The Language Bank's technical support:
kielipankki (at) csc.fi
tel. +358 9 4572001

Requests related to language resources:
fin-clarin (at) helsinki.fi
tel. +358 29 4129317

More contact information