In English

Terminologiafoorumi

Viimeisimmät versiot: 
Terminologiafoorumin sanastoja (kokoelma), lähdeaineisto
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Tämä aineisto on tulossa
pian saataville latauspalveluun
Etsi muut saatavilla olevat versiot 

Aineiston sisältö

Kielipankin Terminologiafoorumi-aineistokokoelmaan kootaan eri alojen suomenkielistä termistöä ja määritelmiä sisältäviä sanastoja, joita harrastajat ja asiantuntijat ovat omilta aloiltaan laatineet. Sanastot on alun perin julkaistu yksityisten, yhdistysten, hankkeiden, yritysten tai muiden tahojen verkkosivuilla. Ne tarjoavat hyödyllistä tietoa alan ammattilaisille, harrastajille, kääntäjille, opettajille, opiskelijoille, kielentutkijoille ja muille alasta kiinnostuneille.

Aineisto on tulossa Kielipankin kautta avoimesti saataville Creative Commons Nimeä 4.0 Kansainvälinen -lisenssillä. Sanastot on julkaistu kokoelmassa niiden laatijoiden tai koostajien luvalla. Kuvat on tekijänoikeussyistä jätetty pois. Käytön yhteydessä kokoelmaan ja siitä käytettyyn versioon on viitattava asianmukaisesti. Kokoelman sisällä olevien yksittäisten sanastojen tarkemmat viittausohjeet löytyvät kyseisten sanastojen kuvailutietosivuilta.

Sanastot on tallennettu Kielipankkiin sellaisenaan eikä niiden sisältöä, termejä, käsitteiden määritelmiä tai erikielisiä vastineita ole tarkastettu tai toimitettu, joten ne saattavat sisältää epätäydellisyyksiä tai virheellisyyksiä. Sanastoista saadut tiedot kannattaa kulloinkin tarkistaa myös muista lähteistä. Tarkemmat aineistokohtaiset käyttöehdot löytyvät aineistoversioiden kuvailutiedoista.

Taustaa

Sanastokokoelman taustalla on Kielipankin sekä Vaasan yliopiston tuottaman Terminology Forumin yhteistyöhanke. Hankkeessa kartoitettiin suomenkielistä termistöä sisältäviä verkossa julkaistuja sanastoja (553 kpl), joista valittiin pilottiaineistoksi noin 20 sanastoa. Sanastojen laatijoihin otettiin yhteyttä julkaisuluvan saamiseksi. Ensimmäiseen julkaisuun valikoitui 10 sanastoa, joiden avulla tallentamisprosessia päästiin testaamaan. Sanastoja on tarkoitus mahdollisuuksien mukaan vähitellen lisätä.

Tämän sivun pysyvä tunniste: http://urn.fi/urn:nbn:fi:lb-2021082322

Psycholinguistic Descriptives

This material comprises a dataset and a query tool for acquiring commonly used psycholinguistic descriptives for Finnish words. The dataset is based on six large corpora from sources such as magazines, newspapers, movie and tv-series subtitles, encyclopedia topics and Internet discussions.
The material includes word surface form frequencies, lemma frequencies, syllable frequencies and letter n-gram frequencies. In addition the query tool can be used to acquire descriptives such as orthographic neighbors for lists of words.

Latest versions/subcorpora:
Psycholinguistic Descriptives
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Download the resource
Search for these versions in META-SHARE

Of this language corpus different versions are (or might be in the future) published in the Language Bank of Finland. The versions are available through the Language Bank Download Service and/or through the Korp concordance tool. The links to the different versions can be found from the list above.

Detailed information on the content of each version, user rights and licenses can be found from it’s specific metadata record in META-SHARE.

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2021081601

Opusparcus: Open Subtitles Paraphrase Corpus for Six Languages

Opusparcus is a paraphrase corpus for six European languages: German, English, Finnish, French, Russian, and Swedish. The paraphrases are extracted from the OpenSubtitles2016 corpus, which contains subtitles from movies and TV shows.

The data in Opusparcus has been extracted from OpenSubtitles2016 (http://opus.nlpl.eu/OpenSubtitles2016.php), which is in turn based on data from http://www.opensubtitles.org.

For each target language, the Opusparcus data have been partitioned into three types of data sets: training, development and test sets. The training sets are large, consisting of millions of sentence pairs, and have been compiled automatically, with the help of probabilistic ranking functions. The development and test sets consist of sentence pairs that have been annotated manually; each set contains approximately 1000 sentence pairs that have been verified to be acceptable paraphrases by two annotators.

Opusparcus is available for download at the Language Bank of Finland. The README file in the download folder contains detailed descriptions of the data sets.

Please cite the following paper in any work that utilizes any part of the Opusparcus corpus:
Mathias Creutz (2018). Open Subtitles Paraphrase Corpus for Six Languages. In Proceedings of the 11th edition of the Language Resources and Evaluation Conference (LREC 2018), 7-12 May, Miyazaki, Japan.

Latest versions/subcorpora:
Opusparcus: Open Subtitles Paraphrase Corpus for Six Languages (version 1.0)
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Download the resource
Search for these versions in META-SHARE

Of this language corpus different versions are (or might be in the future) published in the Language Bank of Finland. The versions are available through the Language Bank Download Service and/or through the Korp concordance tool. The links to the different versions can be found from the list above.

Detailed information on the content of each version, user rights and licenses can be found from it’s specific metadata record in META-SHARE.

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2021081203

Finnish OpenSubtitles 2017

The corpus contains Finnish subtitles for movies and TV-series from http://www.opensubtitles.org

The corpus is a derivative of the [OPUS OpenSubtitles2018](http://opus.nlpl.eu/OpenSubtitles2018.php) multilingual corpus. Information on the material processing up to sentence splitting can be found in the original publication Lison & Tiedemann (2016). The corpus has been tokenized and annotated with morpho-syntactic analysis produced with the [Turku Dependency Parser](http://turkunlp.github.io/Finnish-dep-parser/). P. Lison and J. Tiedemann, 2016, OpenSubtitles2016: Extracting Large Parallel Corpora from Movie and TV Subtitles. In Proceedings of the 10th International Conference on Language Resources and Evaluation (LREC 2016)

Latest versions/subcorpora:
Finnish OpenSubtitles 2017, Kielipankki Korp Version
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Select the corpus in Korp
Finnish OpenSubtitles 2017, source
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Download the resource
Finnish OpenSubtitles 2017, VRT
icon-info-circleMetadata and license
icon-quote-rightAttribution instructions
Download the resource
Search for these versions in META-SHARE

Of this language corpus different versions are published in the Language Bank of Finland. The versions are available through the Language Bank Download Service and/or through the Korp concordance tool. The links to the different versions can be found from the list above.

Detailed information on the content of each version, user rights and licenses can be found from it’s specific metadata record in META-SHARE.

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2021081202

Italian Letters from the Sixteenth Century

This corpus offers a collection of italian letters from the sixteenth century, from different sources.

1) Giovanni FERRO, Lettere varie di complimenti amorose, e giocose [&], In Venetia, Ad istanza di Stefano Curti, 1679 (Universitäts- und Forschungsbibliothek Erfurt/Gotha – Phil 8° 01183/05)

2) Ferrante PALLAVICINO Luca ASSARINO, Lettere amorose, s.n.t. [XVII sec.] (Vicenza, Biblioteca Bertoliana, B.4.3.26) (c) Vicenza, Biblioteca Bertoliana

3) Concetti amorosi, cioè lettere giovenili, et amorose [&], In Modena, ad instantia di Mafeo Tagietti, detto il Verginio, et Ieronimo da Vinetia Compagni, 1553 (Milano, Biblioteca Trivulziana, Triv M 235/1) (c) Historical Archive and Library Trivulziana. City of Milan.

The resource has been made available for download in jpeg format.

Latest versions/subcorpora:
Lettere varie di complimenti amorose, e giocose
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Download the resource
Concetti amorosi, cioè lettere giovenili, et amorose
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Download the resource
Lettere amorose
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Download the resource
Search for these versions in META-SHARE

Of this language corpus different versions are published in the Language Bank of Finland. The versions are available through the Language Bank Download Service and/or through the Korp concordance tool. The links to the different versions can be found from the list above.

Detailed information on the content of each version, user rights and licenses can be found from it’s specific metadata record in META-SHARE.

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2016031701

FinnSentiment

FinnSentiment is a Finnish social media corpus for sentiment polarity annotation. 27,000 sentence data set annotated independently with sentiment polarity by three native annotators. The corpus and its creation has been documented in https://arxiv.org/pdf/2012.02613.pdf.

Latest versions/subcorpora:
FinnSentiment, source
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Download the resource
Search for these versions in META-SHARE

Of this language corpus different versions are (or might be in the future) published in the Language Bank of Finland. The versions are available through the Language Bank Download Service and/or through the Korp concordance tool. The links to the different versions can be found from the list above.

Detailed information on the content of each version, user rights and licenses can be found from it’s specific metadata record in META-SHARE.

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2021081106

Aalto Finnish Parliament ASR Corpus 2008-2020

This corpus is extracted from the Finnish parliament plenary session transcripts and videos by the
Aalto Speech Recognition group. The original session transcripts and videos are available at the web
portals of the Parliament of Finland (avoindata.eduskunta.fi and verkkolahetys.eduskunta.fi). The
corpus is split into three parts:
1. 2015-2020 set
2. 2008-2016 set
3. Development and evaluation sets

A non-overlapping combination of the 2008-2016 set and the 2015-2020 set form a training set of size:
– 1 422 318 sample pairs
– 3 130 hours of speech
– 19 356 831 word tokens

All audio files in this corpus are single-channel wavs with sample rate 16 kHz and 16-bit precision.
The transcript files (.trn) are plain text files.

Latest versions/subcorpora:
Aalto Finnish Parliament ASR Corpus 2008-2020
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Download the resource
Search for these versions in META-SHARE

Of this language corpus different versions are (or might be in the future) published in the Language Bank of Finland. The versions are available through the Language Bank Download Service and/or through the Korp concordance tool. The links to the different versions can be found from the list above.

Detailed information on the content of each version, user rights and licenses can be found from it’s specific metadata record in META-SHARE.

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2021081105

Finnish Proverb Collection

The collection includes dialectal proverbs collected from various areas in the 1930s. This is a resource of Kotimaisten kielten keskus, the Institute for the Languages of Finland. For more information please see https://kaino.kotus.fi/korpus/sp/meta/sp_coll_rdf.xml.

This resource contains only a part of the 1.4 million proverbs collected in different regions of Finland. The National Archives of Finland have digitized quite a few of the handwritten cards containing proverbs. The digitized cards are available in jpg format at http://digi.narc.fi/digi/dosearch.ka?sartun=385077.KA

Latest versions/subcorpora:
Proverb Collection, Kielipankki Version
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Select the corpus in Korp
Search for these versions in META-SHARE

Of this language corpus different versions are (or might be in the future) published in the Language Bank of Finland. The versions are available through the Language Bank Download Service and/or through the Korp concordance tool. The links to the different versions can be found from the list above.

Detailed information on the content of each version, user rights and licenses can be found from it’s specific metadata record in META-SHARE.

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2021081104

The Magazine Corpus of the Institute for the Languages of Finland

The corpus contains different volumes of four magazines: Suomen Kuvalehti, Historiallinen aikakauskirja, Lakimies and Suomi.

Suomen Kuvalehti’s volumes: 1917, 1925, 1935, 1945, 1955, 1965, 1972 (approximately 5,4 million tokens).

Historiallinen Aikakauskirja’s volumes : 1917, 1920, 1925, 1935, 1945.

Lakimies’ volumes: 1917, 1920, 1925, 1935, 1945, 1955, 1965, 1972.

Suomi’s volumes: 1917, 1920, 1923, 1935, 1938.

The corpus is made up of two parts: one whose OCR (optical character recognition) has been checked and another one whose OCR hasn’t been checked. The former part’s size is 670 000 tokens and contains one 1935 issue from Historiallinen Aikakauskirja, Lakimies and Suomi, as well as 4 issues of Suomen Kuvalehti from each of the years mentioned above (1917, 1925, 1935, 1945, 1955, 1965 and 1972). These issues were chosen so that there would be an equal amount of texts from all year round.

Latest versions/subcorpora:
The Magazine Corpus of the Institute for the Languages of Finland, revised
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Select the corpus in Korp
The Magazine Corpus of the Institute for the Languages of Finland, unrevised
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Select the corpus in Korp
The Downloadable Version of the Magazine Corpus of the Institute for the Languages of Finland, revised
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
The resource will be available soon
The Downloadable Version of the Magazine Corpus of the Institute for the Languages of Finland, unrevised
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
The resource will be available soon
Search for these versions in META-SHARE

Of this language corpus different versions are published in the Language Bank of Finland. The versions are available through the Language Bank Download Service and/or through the Korp concordance tool. The links to the different versions can be found from the list above.

Detailed information on the content of each version, user rights and licenses can be found from it’s specific metadata record in META-SHARE.

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-201407301

Corpus of Translated Finnish

The Corpus of Translated Finnish has been compiled in 1999 in the University of Eastern Finland (University of Joensuu at the time and it’s School of Translation Studies) in the project ’Translation Universals’, led by professor Anna Mauranen.

The corpus comprises two parts: texts originally written in Finnish and texts translated into Finnish from different languages. The following text types are represented in the corpus: academic texts, literature, childrens’ literature, biography, popular literature and fiction, detective fiction and popular science.

Latest versions/subcorpora:
Corpus of Translated Finnish, Korp
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Select the corpus in Korp
Search for these versions in META-SHARE

Of this language corpus different versions are (or might be in the future) published in the Language Bank of Finland. The versions are available through the Language Bank Download Service and/or through the Korp concordance tool. The links to the different versions can be found from the list above.

Detailed information on the content of each version, user rights and licenses can be found from it’s specific metadata record in META-SHARE.

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2021081102Laws and Directives

This corpus contains Finnish laws and directives from 1980 to 2003. It is a corpus of Kotimaisten kielten keskus, the Institute for the Languages of Finland.

Latest versions/subcorpora:
Laws and Directives, Kielipankki Version
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Select the corpus in Korp
Search for these versions in META-SHARE

Of this language corpus different versions are (or might be in the future) published in the Language Bank of Finland. The versions are available through the Language Bank Download Service and/or through the Korp concordance tool. The links to the different versions can be found from the list above.

Detailed information on the content of each version, user rights and licenses can be found from it’s specific metadata record in META-SHARE.

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2021081101

Nyt latauspalvelussa: Haastatteluaineisto Yves Montand Neuvostoliitossa, lähdemateriaali

Haastatteluaineisto Yves Montand Neuvostoliitossa, lähdemateriaali (MONTINT-aineisto) on nyt saatavilla Kielipankin latauspalvelussa.

Aineistoon pohjautuvaa tutkimusta on julkaistu myös tuoreessa teoksessa:

Oiva, Mila; Salmi, Hannu; Johnson, Bruce (2021). Yves Montand in the USSR: Cultural Diplomacy and Mixed Messages. Palgrave Macmillan, Cham. http://doi.org/10.1007/978-3-030-69048-9

Jehovah’s Witnesses Magazines 2010-2016

Jehovah’s Witnesses’ bible-based magazines: ’Awake!’, ’The Watchtower’, ’The Watchtower – Study Edition’ and ’The Watchtower – Study Edition (Simplified)’

Harvested from https://www.jw.org/en/library/magazines/ for the years 2010-2016, for all available languages.

Latest versions/subcorpora:
Jehovah’s Witnesses The Watchtower – Study Edition (Simplified) 2011-2016, Korp
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Resource will be available soon
Jehovah’s Witnesses Magazines 2010-2016, Korp
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Resource will be available soon
Search for all versions in META-SHARE

Of this language corpus different versions/subcorpora are (or might be in the future) published in the Language Bank of Finland. The versions are available through the Language Bank Download Service and/or through the Korp concordance tool. The links to the different versions can be found from the list above.

Detailed information on the content of each version, user rights and licenses can be found from it’s specific metadata record in META-SHARE.

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2021061821

Suomeksi

Data protection terms and conditions (SSDC-2016)

Title of Resource: Skolt Saami Documentation Corpus (2016)

Metadata: urn:nbn:fi:lb-2014073037
License: urn:nbn:fi:lb-2017100122

This page describes the specific conditions regarding the processing of the personal data in this Resource. In addition to these conditions, see the guidelines for processing personal data in the Language Bank of Finland.

Controller of the data stored in the Language Bank of Finland

University of Helsinki
PO Box 3
00014 University of Helsinki
Phone: 02941 911

For further details on the data protection of the resources in the Language Bank of Finland, please contact FIN-CLARIN helpdesk.

Data Protection Officer of the University of Helsinki

Email: tietosuoja@helsinki.fi

Description of the personal data

Types of personal data in the Resource

This information is currently being updated. Please check the metadata of the Resource (see the link on top of this page).

Categories of data subjects

This information is currently being updated. Please check the metadata of the Resource (see the link on top of this page).

Data protection terms and conditions for this Resource

In these data protection terms and conditions, End-User means the party acting as the Controller for the Resource received, in accordance with the General Data Protection Regulation (EU) 2016/679. Depending on the case and the purpose of Resource use, End-User may therefore mean the CLARIN service user’s employer or organisation (e.g., a university, university of applied sciences or other research organisation) or the service user personally.

The End-User understands that when receiving the Resource, it becomes a Controller, as referred to in the data protection legislation. The End-User must ensure that it complies with the applicable data protection legislation when processing personal data.

The purpose of use of personal data

 • The Resource may only be used for the research purpose described in the research plan approved by the Controller.

Location and transfer of the personal data (in Finnish only)

 • Personal data may not be processed outside the European Economic Area.

In order to process the Resource outside the European Economic Area, a license may be granted only on the basis of a separate application. In that case, please contact the Language Bank of Finland.

Publish a link to your Privacy Notice

When you start using this Resource, share the title of your project that is understandable to the general public as well as the link to the publicly available privacy notice by using this form. This information will be published on the website of the Language Bank of Finland.

Updates

This page was last updated on 24.6.2021.

Persistent identifier of this page: urn:nbn:fi:lb-2021062245

In English

Aineistokohtaiset tietosuojaehdot (SSDC-2016)

Aineiston nimi: Koltansaamen dokumentaatiokorpus (2016)

Aineiston kuvailutiedot: urn:nbn:fi:lb-2014073037
Lisenssi: urn:nbn:fi:lb-2017100121

Tämä Aineisto sisältää henkilötietoja, joiden käsittelyä koskevat erityisehdot on kuvattu tällä sivulla. Tutustu lisäksi henkilötietoja sisältävien Kielipankin aineistojen käsittelyohjeisiin.

Kielipankkiin talletetun aineiston rekisterinpitäjä

Helsingin yliopisto
PL 3
00014 Helsingin yliopisto
Puhelin: 02941 911

Lisätietoja Kielipankin aineistojen tietosuojasta voit pyytää FIN-CLARINin asiakaspalvelusta.

Helsingin yliopiston tietosuojavastaava

Sähköpostiosoite: tietosuoja@helsinki.fi

Henkilötietojen kuvaus

Aineiston sisältämien henkilötietojen tyypit

Aineisto sisältää eri-ikäisten koltansaamen puhujien haastatteluäänitteitä, jotka on litteroitu ja analysoitu kielitieteellisesti. Analyysiin sisältyy myös suomen- ja englanninkielinen käännös.

Ääniteaineistoa ei ole mahdollista käsitellä tunnisteettomaksi niin, että se kuitenkin säilyisi esimerkiksi kielitieteellisen tutkimuksen kannalta käyttökelpoisena. Alkuperäisten nauhoitusten alussa mainitut haastateltavien nimet ja muut suorat tunnisteet on leikattu pois äänitteistä, mutta muu osa haastatteluista sekä tekstimuotoiset litteraatit saattavat sisältää suoria tai epäsuoria tunnisteita. Aineistossa on mukana tieto haastateltavien koltansaamen puhujien sukupuolesta ja  syntymävuosikymmenestä. Tutkimuksen keräämiseen osallistuneiden haastattelijoiden nimet on jätetty aineistossa näkyviin.

Tiedostojen ja hakemistojen nimissä ja aineistosta tehdyissä tekstimuotoisissa litteraateissa tutkittaviin viitataan koodeilla. Koodiavain on rekisterinpitäjän (yhteyshenkilön) hallussa ja sitä säilytetään erillään varsinaisesta aineistosta.

Rekisteröityjen ryhmät

Tietoja päivitetään parhaillaan. Tarkistathan Aineiston kuvailutiedot (ks. linkki sivun yläreunassa).

Aineistoon liittyvät erityiset tietosuojaehdot

Käyttäjällä tarkoitetaan näissä tietosuojaehdoissa sitä tahoa, joka toimii vastaanotettavan Aineiston rekisterinpitäjänä yleisen tietosuoja-asetuksen (EU) 2016/679 mukaan. Käyttäjä voi siis tapauksesta ja Aineiston käyttötarkoituksesta riippuen olla Kielipankin käyttäjän työnantaja tai organisaatio, jossa hän toimii (esimerkiksi yliopisto, ammattikorkeakoulu tai muu tutkimusorganisaatio) tai palvelun käyttäjä henkilökohtaisesti.

Käyttäjä ymmärtää, että Aineistoa vastaanottaessaan siitä tulee soveltuvan tietosuojalainsäädännön mukaan rekisterinpitäjä. Käyttäjä on vastuussa siitä, että se noudattaa henkilötietojen käsittelyssä soveltuvaa tietosuojalainsäädäntöä.

Henkilötietojen käyttötarkoitus

 • Aineistoa saa käyttää ainoastaan Rekisterinpitäjän hyväksymässä tutkimussuunnitelmassa kuvattuun tutkimustarkoitukseen.

Henkilötietojen sijainti

 • Aineistoa ei saa käsitellä Euroopan talousalueen ulkopuolella.

Aineiston voi saada käsiteltäväksi Euroopan talousalueen ulkopuolella vain erillisestä hakemuksesta. Ota siinä tapauksessa yhteyttä Kielipankkiin.

 

Julkaise linkki omaan tietosuojailmoitukseen

Kun ryhdyt käyttämään tätä Aineistoa, ilmoita oman hankkeesi yleistajuinen otsikko sekä avoimesti saatavilla olevan tietosuojaselosteen linkki Kielipankille tällä lomakkeella. Ilmoitetut tiedot julkaistaan Kielipankin verkkosivuilla.

Päivitykset

Tätä sivua on viimeksi päivitetty 24.6.2021.

 

Tämän sivun pysyvä tunniste: urn:nbn:fi:lb-2021062246

 

Suomeksi

Data protection terms and conditions (DSPCON)

Title of Resource: Aalto University DSP Course Conversation Corpus 2013- (DSPCON)

Metadata: urn:nbn:fi:lb-2015101901
License: urn:nbn:fi:lb-2016112312

This page describes the specific conditions regarding the processing of the personal data in this Resource. In addition to these conditions, see the guidelines for processing personal data in the Language Bank of Finland.

Controller of the data stored in the Language Bank of Finland

University of Helsinki
PO Box 3
00014 University of Helsinki
Phone: 02941 911

For further details on the data protection of the resources in the Language Bank of Finland, please contact FIN-CLARIN helpdesk.

Data Protection Officer of the University of Helsinki

Email: tietosuoja@helsinki.fi

Description of the personal data

Types of personal data in the Resource

This information is currently being updated. Please check the metadata of the Resource (see the link on top of this page).

Categories of data subjects

This information is currently being updated. Please check the metadata of the Resource (see the link on top of this page).

Data protection terms and conditions for this Resource

In these data protection terms and conditions, End-User means the party acting as the Controller for the Resources received, in accordance with the General Data Protection Regulation (EU) 2016/679. Depending on the case and the purpose of Resource use, End-User may therefore mean the CLARIN service user’s employer or organisation (e.g., a university, university of applied sciences or other research organisation) or the service user personally.

The End-User understands that when receiving the Resource, it becomes a Controller, as referred to in the data protection legislation. The End-User must ensure that it complies with the applicable data protection legislation when processing personal data.

The purpose of use of personal data

 • The Resource may only be used for non-commercial research or teaching purposes.

Location and transfer of the personal data (in Finnish only)

 • Personal data may not be processed outside the European Economic Area.

In order to process the Resource outside the European Economic Area, a license may be granted only on the basis of a specific application. In that case, please contact the Language Bank of Finland.

Publish a link to your Privacy Notice

When you start using this Resource, share the title of your project that is understandable to the general public as well as the link to the publicly available privacy notice by using this form. This information will be published on the website of the Language Bank of Finland.

Updates

This page was last updated on 24.6.2021.

Persistent identifier of this page: urn:nbn:fi:lb-2021062221

Suomeksi

Data protection terms and conditions (aku-egg)

Title of Resource: Speech and EGG (Electroglottography) Simultaneous Recordings (aku-egg)

Metadata: urn:nbn:fi:lb-2020112923
License: urn:nbn:fi:lb-2015041301

This page describes the specific conditions regarding the processing of the personal data in this Resource. In addition to these conditions, see the guidelines for processing personal data in the Language Bank of Finland.

Controller of the data stored in the Language Bank of Finland

University of Helsinki
PO Box 3
00014 University of Helsinki
Phone: 02941 911

For further details on the data protection of the resources in the Language Bank of Finland, please contact FIN-CLARIN helpdesk.

Data Protection Officer of the University of Helsinki

Email: tietosuoja@helsinki.fi

Description of the personal data

Types of personal data in the Resource

The Resource contains brief speech samples (individual words, isolated vowels and some read-aloud text about weather phenomena) from individual speakers and the EGG signal that was registered simultaneously from them. The recordings were made in acoustically high quality conditions. It may be possible to identify individual speakers on the basis of their voice, but apart from the speech signals, he Resource does not contain any other identifying information.

Categories of data subjects

The participants were 12 native Finnish speaking adult volunteers (6 male, 6 female).

Data protection terms and conditions for this Resource

In these data protection terms and conditions, End-User means the party acting as the Controller for the Resource received, in accordance with the General Data Protection Regulation (EU) 2016/679. Depending on the case and the purpose of Resource use, End-User may therefore mean the CLARIN service user’s employer or organisation (e.g., a university, university of applied sciences or other research organisation) or the service user personally.

The End-User understands that when receiving the Resource, it becomes a Controller, as referred to in the data protection legislation. The End-User must ensure that it complies with the applicable data protection legislation when processing personal data.

The purpose of use of personal data

 • The Resource may only be used for non-commercial research or teaching purposes.

Location and transfer of the personal data

 • Personal data may not be processed outside the European Economic Area.

In order to process the Resource outside the European Economic Area, a license may be granted only on the basis of a specific application. In that case, please contact the Language Bank of Finland.

Publish a link to your Privacy Notice

When you start using this Resource, share the title of your project that is understandable to the general public as well as the link to the publicly available privacy notice by using this form. This information will be published on the website of the Language Bank of Finland.

Updates

This page was last updated on 24.6.2021.

Persistent identifier of this page: urn:nbn:fi:lb-2021062229

In English

Aineistokohtaiset tietosuojaehdot (aku-egg)

Aineiston nimi: Puheen ja EGG:n samanaikaiset tallenteet

Aineiston kuvailutiedot: urn:nbn:fi:lb-2020112923
Lisenssi: urn:nbn:fi:lb-2015041301

Aineisto sisältää henkilötietoja, joiden käsittelyä koskevat erityisehdot on kuvattu tällä sivulla. Tutustu lisäksi henkilötietoja sisältävien Kielipankin aineistojen käsittelyohjeisiin.

Kielipankkiin talletetun aineiston rekisterinpitäjä

Helsingin yliopisto
PL 3
00014 Helsingin yliopisto
Puhelin: 02941 911

Lisätietoja Kielipankin aineistojen tietosuojasta voit pyytää FIN-CLARINin asiakaspalvelusta.

Helsingin yliopiston tietosuojavastaava

Sähköpostiosoite: tietosuoja@helsinki.fi

Henkilötietojen kuvaus

Aineiston sisältämien henkilötietojen tyypit

Aineisto sisältää lyhyitä puhenäytteitä (irrallisina äännettyjä sanoja ja vokaaleja sekä ääneen luettua sääaiheista tekstiä) yksittäisiltä puhujilta sekä heiltä samanaikaisesti tallennettua elektroglottografiasignaalia (EGG). Yksittäisiä puhujia saattaa olla mahdollista tunnistaa puheäänitteen perusteella, mutta Aineisto ei sisällä muita heitä koskevia tunnistetietoja.

Rekisteröityjen ryhmät

Tutkimukseen osallistuneet puhujat olivat aikuisia, äidinkielenään suomea puhuvia vapaaehtoisia henkilöitä. Puhujia oli yhteensä 12 (6 naista, 6 miestä).

Aineistoon liittyvät erityiset tietosuojaehdot

Käyttäjällä tarkoitetaan näissä tietosuojaehdoissa sitä tahoa, joka toimii vastaanotettavan aineiston rekisterinpitäjänä yleisen tietosuoja-asetuksen (EU) 2016/679 mukaan. Käyttäjä voi siis tapauksesta ja aineiston käyttötarkoituksesta riippuen olla Kielipankin käyttäjän työnantaja tai organisaatio, jossa hän toimii (esimerkiksi yliopisto, ammattikorkeakoulu tai muu tutkimusorganisaatio) tai palvelun käyttäjä henkilökohtaisesti.

Käyttäjä ymmärtää, että aineistoa vastaanottaessaan siitä tulee soveltuvan tietosuojalainsäädännön mukaan rekisterinpitäjä. Käyttäjä on vastuussa siitä, että se noudattaa henkilötietojen käsittelyssä soveltuvaa tietosuojalainsäädäntöä.

Henkilötietojen käyttötarkoitus

 • Aineistoa saa käyttää ainoastaan ei-kaupalliseen tutkimus- tai opetustarkoitukseen.

Henkilötietojen sijainti

 • Aineistoa ei saa käsitellä Euroopan talousalueen ulkopuolella.

Aineiston voi saada käsiteltäväksi Euroopan talousalueen ulkopuolella vain erillisestä hakemuksesta. Ota siinä tapauksessa yhteyttä Kielipankkiin.

Julkaise linkki omaan tietosuojailmoitukseen

Kun ryhdyt käyttämään tätä Aineistoa, ilmoita hankkeesi yleistajuinen otsikko sekä avoimesti saatavilla olevan tietosuojaselosteen linkki Kielipankille tällä lomakkeella. Ilmoitetut tiedot julkaistaan Kielipankin verkkosivuilla.

Päivitykset

Tätä sivua on viimeksi päivitetty 24.6.2021.

Tämän sivun pysyvä tunniste: urn:nbn:fi:lb-2021062230

North Saami Corpus (Literature) (UHLCS)

The North Saami Corpus contains Kerttu Vuolab’s novel Cheppari cháráhus written in Northern Sami. The corpus is a part of the UHLCS corpus collection.

UHLCS has many different IPR holders. Should you have any questions regarding the collection, please contact Pirkko Suihkonen (suihkonen.pirkko@gmail.com).

Latest versions/subcorpora:
North Saami Corpus (Literature) (UHLCS)
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
The data is available upon request via CSC’s computing environment
North Saami Corpus (Literature) (UHLCS), Helsinki Korp Version
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
The resource will be available soon
Search for all versions in META-SHARE

Of this language corpus different versions/subcorpora are (or might be in the future) published in the Language Bank of Finland. The versions are available through the Language Bank Download Service and/or through the Korp concordance tool. The links to the different versions can be found from the list above.

Detailed information on the content of each version, user rights and licenses can be found from it’s specific metadata record in META-SHARE.

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2021061605

Finnish Corpus (Literature) (UHLCS)

The Finnish Corpus is a part of the UHLCS corpus collection.

UHLCS has many different IPR holders. Should you have any questions regarding the collection, please contact Pirkko Suihkonen (suihkonen.pirkko@gmail.com).

Latest versions/subcorpora:
Finnish Corpus (Literature) (UHLCS)
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
The data is available upon request via CSC’s computing environment
Finnish Corpus (Literature) (UHLCS), Helsinki Korp Version
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
The resource will be available soon
Search for all versions in META-SHARE

Of this language corpus different versions/subcorpora are (or might be in the future) published in the Language Bank of Finland. The versions are available through the Language Bank Download Service and/or through the Korp concordance tool. The links to the different versions can be found from the list above.

Detailed information on the content of each version, user rights and licenses can be found from it’s specific metadata record in META-SHARE.

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2021061604

Hae Kielipankki-portaalista:
Juho Leinonen
Kuukauden tutkija: Juho Leinonen

 

Tulevat tapahtumat

 1. CLARIN Annual Conference 2021

  27.9.2021 10.0029.9.2021 16.15

Yhteystiedot

Kielipankin tekninen ylläpito:
kielipankki (ät) csc.fi
p. 09 4572001

Aineistoihin ja muuhun sisältöön liittyvät asiat:
fin-clarin (ät) helsinki.fi
p. 029 4129317

Tarkemmat yhteystiedot