In English

Haastatteluaineisto Yves Montand Neuvostoliitossa (MONTINT)

Viimeisimmät versiot: 
Haastatteluaineisto Yves Montand Neuvostoliitossa, lähdemateriaali
icon-info-circle Kuvailutiedot ja lisenssi
icon-exclamation-triangle PRIV: Tutustu henkilötietojen käsittelyohjeisiin
icon-quote-rightViittausohje tähän versioon
Aineisto tulee pian ladattavaksi
Etsi muut saatavilla olevat versiot

Korpuksen sisältö

Haastatteluaineisto käsittelee venäläisten muistoja italialais-ranskalaisen näyttelijä-laulaja Yves Montandin Neuvostoliiton kiertueesta vuonna 1956-57. Tarkemmat tiedot löytyvät kunkin aineistoversion kuvailutiedoista.


Aineiston tietosuoja

Haastatteluaineisto Yves Montand Neuvostoliitossa (MONTINT) sisältää henkilötietoja. Niiden osalta sinun on noudatettava Kielipankin ohjeita henkilötietoja sisältävien aineistojen käsittelyyn. Alla kuvataan tämän aineiston sisältämät henkilötietojen ryhmät ja kerrotaan tarkemmin henkilötietojen käsittelyyn liittyvistä lisärajoituksista.

Tutustu tarvittaessa lisäksi alkuperäisen aineiston tietosuojaselosteeseen.

Aineiston sisältämien henkilötietojen ryhmät

Aineisto sisältää haastateltavien etu- ja sukunimet sekä isännimen; pelkän etu- ja sukunimen; pelkän etunimen tai nimimerkin riippuen siitä, mitä tietoja haastateltava halusi antaa. Tämän lisäksi aineisto sisältää haastateltavien syntymävuoden tai aikahaarukan jolloin haastateltava on syntynyt. Lisäksi aineistossa ilmenee haastattelupaikka ja sitä kautta haastateltavien asuinpaikat.

Mukana on sellaisten venäläisten henkilöiden haastatteluja, joilla oli joko henkilökohtaisia tai ”perittyjä” muistoja Yves Montandin kiertueesta. Haastateltavat löytyivät haastattelijoina toimineiden opiskelijoiden tuttavapiiristä tai sosiaalisen median kautta.

Aineiston käsittely Suomen rajojen ulkopuolella

Tähän aineistoon sisältyviä henkilötietoja saa käsitellä Euroopan talousalueen ulkopuolella ainoastaan yleisen tietosuoja-asetuksen V luvun vaatimuksia noudattaen.

Suomeksi

Yves Montand in the USSR interviews (MONTINT)

Current versions of this resource: 
Yves Montand in the USSR interviews, source
icon-info-circle Metadata and license
icon-exclamation-triangle PRIV: See privacy guidelines
icon-quote-rightAttribution instructions
The resource will soon be available for download
Look for other versions of this resource

Corpus contents

The corpus contains transcripts of interviews regarding personal memories and family stories about the tour of the French-Italian singer-actor Yves Montand in the Soviet Union in 1956-57.

Other details about the content and the terms and conditions regarding the different corpus versions are available in the corresponding metadata records.


Privacy guidelines

The corpus Yves Montand in the USSR interviews (MONTINT) contains personal data. When using the corpus, follow the personal data guidelines provided by the Language Bank of Finland. Below, you can find a description of the types of personal data that are included in the corpus as well as further details on specific restrictions that you need to comply with when processing the personal data in question.

In addition, please refer to the Privacy Notice provided by the original data controller.

Description of personal data categories

(This part will contain the description and corpus-specific restrictions regarding the processing of the personal data in the corpus, as stated by the data controller in the deposition license agreement. For now, see the description in Finnish.)

Restrictions concerning transfer of the personal data outside Finland

(For now, see the description in Finnish.)

Suomeksi

Corpus Cyrillo-Methodianum Helsingiense: Corpus of Old Church Slavonic Texts

Viimeisimmät versiot: 
Corpus Cyrillo-Methodianum Helsingiense: Corpus of Old Church Slavonic Texts, source
icon-info-circle Metadata and license
icon-quote-right Citation instructions of this version
Download
Browse the content as a web site
Search for other versions of this resource 

Content of this resource

The Corpus Cyrillo-Methodianum Helsingiense (CCMH) is a corpus of Old Church Slavonic (OCS) texts. It was collected at the University of Helsinki from 1986 to 2017 in various research projects.

Until 2020, the resource was publicly available as a website maintained by the University of Helsinki, and it is now located in Kielipankki – The Language Bank of Finland.

Further details on the content and license are provided in the metadata record of each corpus version.

In English

Corpus Cyrillo-Methodianum Helsingiense: Muinaiskirkkoslaavin korpus

Viimeisimmät versiot: 
Corpus Cyrillo-Methodianum Helsingiense: Muinaiskirkkoslaavin korpus, lähdemateriaali
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Lataa aineisto
Selaa sisältöä verkkosivustona
Etsi muut saatavilla olevat versiot 

Aineiston sisältö

Corpus Cyrillo-Methodianum Helsingiense (CCMH) sisältää Helsingin yliopiston eri tutkimushankkeissa kerättyjä tekstejä muinaiskirkkoslaavin kielellä.

Aineisto on aiemmin ollut saatavilla Helsingin yliopiston verkkosivuilla, joilta se on siirretty Kielipankkiin.

Tarkempaa tietoa käyttöoikeuksista ja sisällöstä löytyy kyseisen aineistoversion kuvailutiedoista.

Suomalainen radio- ja tv-korpus

Viimeisimmät versiot: 
Suomalaisen radio- ja tv-korpuksen Helsinki-LAT-versio
(LAT-palvelussa; tämä versio poistuu marraskuussa 2020)
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Hae käyttöoikeutta
Avaa aineisto LAT-palvelussa icon-question-circle
Suomalaisen radio- ja tv-korpuksen ladattava versio
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-rig Tämän version viittausohje
Hae käyttöoikeutta
Lataa aineisto
Etsi muut saatavilla olevat versiot 

Tietoa tämän aineiston LAT-version poistumisesta marraskuussa 2020

Kielipankin LAT-alusta poistuu käytöstä marraskuun 2020 aikana. Sen jälkeen tätä aineistoa ei enää pääse käyttämään LAT-näkymän kautta. Kaikki tähän aineistoon kuuluva LATissa ollut sisältö on kuitenkin saatavilla ladattavassa muodossa. Aineiston tutkimista ja käsittelyä voi siis edelleen jatkaa esimerkiksi ELAN-ohjelmalla.

ProGram-aineisto, lumiukko- ja sammakkotarinat

Viimeisimmät versiot: 
ProGram-aineisto, lumiukko- ja sammakkotarinat, ladattava versio
Kuvailutiedot ja lisenssi
Viittausohje tulossa
Lataa aineisto
ProGram-aineisto, lumiukko- ja sammakkotarinat
(LAT-palvelussa; tämä versio on poistunut käytöstä joulukuussa 2020)
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
(ei enää saatavilla; katso latausversio yllä)
Etsi muut saatavilla olevat versiot 

Tietoa tämän aineiston aiemman LAT-version poistumisesta vuoden 2020 lopussa

Kielipankin LAT-alusta on poistunut käytöstä vuoden 2020 lopussa. Tätä aineistoa ei enää pääse käyttämään LAT-näkymän kautta. Kaikki tähän aineistoon kuuluva LATissa ollut sisältö on kuitenkin saatavilla omalle koneelle ladattavana versiona. Aineiston tutkimista ja käsittelyä voi siis edelleen jatkaa esimerkiksi ELAN-ohjelmalla.

Reitti A-siipeen -demokorpus

Viimeisimmät versiot: 
Reitti A-siipeen -korpuksen Helsinki-LAT-versio (LAT-palvelussa; tämä versio poistuu marraskuussa 2020)
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Avaa aineisto LAT-palvelussa icon-question-circle
Reitti A-siipeen -korpuksen Helsinki-Korp-versio
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Avaa aineisto Korp-palvelussa icon-question-circle
Reitti A-siipeen -korpuksen ladattava versio
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-rig Viittausohje tulossa
(Ladattava versio tulossa)
Etsi muut saatavilla olevat versiot 

Tietoa tämän aineiston LAT-version poistumisesta marraskuussa 2020

Kielipankin LAT-alusta poistuu käytöstä marraskuun 2020 aikana. Sen jälkeen tätä aineistoa ei enää pääse käyttämään LAT-näkymän kautta. Kaikki tähän aineistoon kuuluva LATissa ollut sisältö on kuitenkin saatavilla ladattavassa muodossa. Aineiston tutkimista ja käsittelyä voi siis edelleen jatkaa esimerkiksi ELAN– ja Praat-ohjelmilla.

Siirtymävaiheessa joidenkin LATissa olleiden aineistojen saatavuuteen saattaa syntyä tilapäinen katkos vuodenvaihteessa 2020-21, ellei niistä ole ennestään ollut saatavilla vastaavia ladattavia versioita. Mikäli tarvitset tietyn aineiston nopeasti käyttöösi, ota yhteyttä Kielipankkiin. Pyynnöstä voimme järjestää väliaikaisen latausmahdollisuuden. Kiitos!

Koltansaamen dokumentaatiokorpus (2016)

PID: http://urn.fi/urn:nbn:fi:lb-202104203

Viimeisimmät versiot: 
Koltansaamen dokumentaatiokorpus (2016), ladattava versio
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Hae käyttöoikeutta
Lataa aineisto (tulossa pian!)
Koltansaamen dokumentaatiokorpus (2016) LAT-palvelussa
on poistunut käytöstä joulukuussa 2020.
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
(Aineiston LAT-versio ei ole enää saatavilla)
Etsi muut saatavilla olevat versiot 

Tärkeää tietoa tämän aineiston LAT-version poistumisesta marraskuussa 2020

Kielipankin LAT-alusta on poistettu käytöstä joulukuussa 2020. Sen jälkeen tätä aineistoa ei enää voi käyttää LAT-näkymän kautta. Kaikki tähän aineistoon kuuluva LATissa ollut sisältö on kuitenkin tallessa ja korpus on tulossa saataville ladattavassa muodossa samoilla käyttöehdoilla kuin aiemmin. Jatkossa aineistoa voi tutkia ja käsitellä omalla koneella, esimerkiksi Praat– tai ELAN-ohjelmilla.

Kipo-korpus – Suomen viittomakielten kielipoliittinen ohjelma 2010

Viimeisimmät versiot: 
Kipo-korpus (Suomen viittomakielten kielipoliittinen ohjelma 2010), ladattava versio
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-rig Viittausohje
Lataa aineisto
Etsi muut saatavilla olevat versiot 

Aineiston aikaisempaa LAT-versiota vastaava sisältö löytyy nyt Kielipankin latauspalvelusta

Kielipankin LAT-alusta on poistettu käytöstä vuoden 2020 lopussa, eikä tätä aineistoa enää pääse käyttämään LAT-näkymän kautta. Vastaava sisältö on saatavilla ladattavassa muodossa. Aineiston tutkimista ja käsittelyä voi siis jatkaa esimerkiksi ELAN-ohjelmalla.

Pohjoissaamen näytekorpus

Viimeisimmät versiot: 
Pohjoissaamen näytekorpus (vain ladattavana)
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Hae käyttöoikeutta
Lataa aineisto
Etsi muut saatavilla olevat versiot 

Tärkeää tietoa tämän aineiston LAT-version poistumisesta marraskuussa 2020

Kielipankin LAT-alusta poistuu käytöstä marraskuun 2020 aikana. Sen jälkeen tätä aineistoa ei enää voi käyttää LAT-näkymän kautta. Kaikki tähän aineistoon kuuluva LATissa ollut sisältö on kuitenkin tallessa ja korpus tuodaan mahdollisimman pian saataville ladattavassa muodossa samoilla käyttöehdoilla kuin aiemmin. Jatkossa aineistoa voi tutkia ja käsitellä omalla koneella, esimerkiksi Praat– tai ELAN-ohjelmilla.

Siirtymävaiheessa joidenkin LATissa olleiden aineistojen saatavuuteen saattaa syntyä tilapäinen katkos vuodenvaihteessa 2020-21. Mikäli tarvitset aineiston nopeasti käyttöösi, ota yhteyttä Kielipankkiin. Pyynnöstä voimme järjestää väliaikaisen latausmahdollisuuden. Kiitos!

Murteenseuruukorpus

Viimeisimmät versiot: 
Murteenseuruukorpus (LAT-palvelussa; tämä versio poistuu marraskuussa 2020)
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Avaa aineisto LAT-palvelussa icon-question-circle
Etsi muut saatavilla olevat versiot 

Tärkeää tietoa tämän aineiston LAT-version poistumisesta marraskuussa 2020

Kielipankin LAT-alusta poistuu käytöstä marraskuun 2020 aikana. Sen jälkeen tätä aineistoa ei enää voi käyttää LAT-näkymän kautta. Kaikki tähän aineistoon kuuluva LATissa ollut sisältö on kuitenkin tallessa ja korpus tuodaan mahdollisimman pian saataville ladattavassa muodossa samoilla käyttöehdoilla kuin aiemmin. Jatkossa aineistoa voi tutkia ja käsitellä omalla koneella, esimerkiksi Praat– tai ELAN-ohjelmilla.

Siirtymävaiheessa joidenkin LATissa olleiden aineistojen saatavuuteen saattaa syntyä tilapäinen katkos vuodenvaihteessa 2020-21. Mikäli tarvitset aineiston nopeasti käyttöösi, ota yhteyttä Kielipankkiin. Pyynnöstä voimme järjestää väliaikaisen latausmahdollisuuden. Kiitos!

ELFA – English as a Lingua Franca in Academic Settings

Current versions of this resource: 
The Helsinki Korp Version of the ELFA Corpus
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Select the corpus in Korp icon-question-circle
The Transcriptions of the ELFA Corpus, Downloadable Version
icon-info-circle Metadata and license
icon-quote-rightAttribution instructions
Download the resource
The Audio Files of the ELFA Corpus, Downloadable Version
icon-info-circle Metadata and license
icon-quote-rightAttribution instructions
Apply for rights to access the resource
Download the resource
Search for other versions of this resource

The ELFA corpus (English as a Lingua Franca in Academic Settings) contains approximately 1 million words of transcribed spoken academic English as a Lingua Franca (approximately 131 hours of recorded speech).

The data consists of both recordings and their transcripts, which are available in several versions:

Please note that this corpus contains personal data. By using the material, you agree to follow the personal data guidelines given by the Language Bank of Finland.

Further details on the terms and conditions regarding the different corpus versions are available in the corresponding metadata records.

The old LAT version of this corpus was removed in 2020

The experimental corpus version The Helsinki LAT Version of the ELFA Corpus is no longer available since the LAT service (lat.csc.fi) was discontinued in the Language Bank of Finland in December 2020. However, more accessible versions of the same content are maintained in Korp and in the download service.

Suomeksi

Corpus Title

Current versions of this resource: 
Corpus Title, Korp version
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Select the corpus in Korp icon-question-circle
Corpus Title, download version
icon-info-circle Metadata and license
icon-exclamation-triangle PRIV: See privacy guidelines
icon-quote-rightAttribution instructions
Apply for rights to access the resource
Download the resource
Look for other versions of this resource

Information about the removal of the LAT version of this corpus in November 2020

Due to technical reasons, the LAT service (lat.csc.fi) will be discontinued in the Language Bank of Finland as of November 30, 2020. After this, the LAT version of this corpus will no longer be available. However, the content will be made available for download. In case you urgently need the downloadable data, please contact us.

Corpus contents

The corpus consists of…

Other details about the content and the terms and conditions regarding the different corpus versions are available in the corresponding metadata records.

Example queries from the Korp version of this corpus


Privacy guidelines

Corpus XYZ contains personal data. When using the corpus, follow the personal data guidelines provided by the Language Bank of Finland. Below, you can find a description of the types of personal data that are included in the corpus as well as details on additional specific restrictions that you need to comply with when processing the personal data in question.

[This part should contain the description and corpus-specific restrictions regarding the processing of the personal data in the corpus, as stated by the data controller in the deposition license agreement.]

Suomalaisen viittomakielen korpus

Viimeisimmät versiot: 
Suomalaisen viittomakielen korpus: kerronta-aineisto, ladattava versio
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Lataa aineisto
Suomalaisen viittomakielen korpus: keskusteluaineisto, ladattava versio
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Hae käyttöoikeutta
Lataa aineisto
Etsi muut saatavilla olevat versiot 

Tietoa tämän aineiston LAT-versioiden poistumisesta marraskuussa 2020

Kielipankin LAT-alusta poistuu käytöstä marraskuun 2020 aikana. Sen jälkeen tätä aineistoa ei enää pääse käyttämään LAT-näkymän kautta. Kaikki tähän aineistoon kuuluva LATissa ollut sisältö on kuitenkin saatavilla ladattavassa muodossa. Aineiston tutkimista ja käsittelyä voi siis edelleen jatkaa esimerkiksi ELAN-ohjelmalla.

Siirtymävaiheessa joidenkin LATissa olleiden aineistojen saatavuuteen saattaa syntyä tilapäinen katkos vuodenvaihteessa 2020-21, ellei niistä ole ennestään ollut saatavilla vastaavia ladattavia versioita. Mikäli tarvitset tietyn aineiston nopeasti käyttöösi, ota yhteyttä Kielipankkiin. Pyynnöstä voimme järjestää väliaikaisen latausmahdollisuuden. Kiitos!

Puheen ja EGG:n samanaikaiset tallenteet

PID: http://urn.fi/urn:nbn:fi:lb-202104201

Viimeisimmät versiot: 
Puheen ja EGG:n samanaikaiset tallenteet, ladattava versio
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Latauslinkki tulossa
Puheen ja EGG:n samanaikaiset tallenteet
(LAT-versio, poistunut käytöstä)
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
ei enää saatavilla
Etsi muut saatavilla olevat versiot 

Tärkeää tietoa tämän aineiston LAT-version poistumisesta vuonna 2020

Kielipankin LAT-alusta poistui käytöstä joulukuussa 2020. Sen jälkeen tätä aineistoa ei enää voi käyttää LAT-näkymän kautta. Vastaava aineisto tulee saataville Kielipankin latauspalvelussa samoilla käyttöehdoilla kuin aiemmin. Jatkossa aineistoa voi tutkia ja käsitellä omalla koneella, esimerkiksi Praat– tai ELAN-ohjelmilla.

Muoto-opin arkiston kaikki aineisto skannattuina pdf-tiedostoina

Aineistot:  
 Muoto-opin arkiston kaikki sanaliput skannattuina 
Kuvailutiedot ja lisenssi
Viittausohje tähän versioon
 Hae käyttöoikeutta

Tämä aineisto on näköiskopio paperisesta Muoto-opin arkistosta. Se sisältää kaiken aineiston, jota Muoto-opin arkistossa oli keväällä 2020 paperimuodossa. Kaikki on skannattu pdf-tiedostoiksi. Aineistoa on 212 pitäjästä.

Muoto-opin Arkisto sisältää systemaattisesti järjestettyä suomen murteiden kieliopillista aineistoa 212 pitäjänmurteesta. Murre-esimerkit on järjestetty 897 signumia käsittävän morfologisen koodiston eli signumien mukaan.

Signumien sisältö käy ilmi täältä:

http://www.kielipankki.fi/wp-content/uploads/ma_keruuopas.pdf

Aineisto on alun perin kirjoitettu A6-kokoisille arkistolipuille. Arkiston aineiston ovat keränneet on koulutetut kerääjät murrepuheesta.

Tämän alkuperäisaineiston pohjalta on jo aiemmin toteutettu toinen aineisto: DMA eli Digitaalinen Muoto-opin Arkisto (dma-Korp). Se sisältää tietokantamuodossa osan tämän paperiaineiston sisällöstä sekä hiukan muutakin pelkästään tietokantaa varten tallennettua aineistoa. Se osa aineistosta on käytettävissä Korp-käyttöliittymän avulla.

Tietoa Korp-käyttöliittymässä käytettävissä olevasta DMA-aineistosta täällä: https://www.kielipankki.fi/aineistot/dma/

On vielä olemassa aiempi ”Digitaalisen Muoto-opin Arkiston sanaliput” (dma-wn) -aineisto. Se sisältää vain ne sanaliput, joista varsinaisesessa Digitaalisessa Muoto-opin Arkistossa (dma-Korp) on aineistoa. Siihen aineistoon pääsee vain dma-Korpin osumien kautta, jos on hankkinut niiden sanalippujen käyttöluvan.

Käyttöluvan hakeneet voivat lisäksi saada nähdäkseen myös kerääjien kirjoittamat keruukertomukset (pdf-muotoon skannatut) murreaineiston keruun sujumisesta ja aineiston lippumuotoon muokkaamisen vaiheista.

Tällä sivulla luetellaan pitäjät, joista aineistoa on. (Klikkaa sanaa ”Pitäjäluettelo”.)

Suomeksi

DMA, The Digital Morphology Archives

Resources:  
Digital Morphology Archives
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Instructions in Finnish for using the Digital Morphology Archive in Korp
Select the corpus in Korp icon-question-circle
The Word Notes of the Digital Morphology Archives
icon-info-circle Metadata and license
icon-quote-rightAttribution instructions
Apply for rights to access the resource
 

The Digital Morphology Archives (DMA) contains 403 963 morphologically coded dialectal clauses from 160 parishes in different parts of Finland. In addition, the archive contains pictures in pdf format of the word notes on which the example clauses are based. These examples describe the morphological phenomena in context. They are extracts from the spontaneous speech of the informants.

The DMA data are based on the Morphology Archives originally available in paper format. The example clauses are available in the Language Bank of Finland’s concordance service Korp, without registration and for unrestricted use licensed under Creative Commons Attribution 4.0 International. The scanned word notes are available by a separate application via the Language Bank Rights (https://lbr.csc.fi).

Search for references to the language resource in Google Scholar

In English

DMA, Digitaalinen muoto-opin arkisto

Aineistot:
Digitaalinen muoto-opin arkisto
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Viittausohje tähän versioon
Ohjeita Digitaalisen muoto-opin arkiston (DMA) käyttämiseksi Korpissa
Avaa aineisto Korp-palvelussa icon-question-circle
Digitaalisen muoto-opin arkiston sanaliput
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Viittausohje tähän versioon
Hae käyttöoikeutta

Digitaalinen muoto-opin arkisto (DMA) sisältää 403 963 morfologisesti koodattua murrelause-esimerkkiä 160 paikkakunnalta eri puolilta Suomea. Sen lisäksi arkisto sisältää on pdf-kuvat niistä arkiston paperilipuista, joista esimerkkilauseet ovat peräisin. Lause-esimerkit kuvaavat morfologisia ilmiöitä esiintymiskontekstissaan. Ne ovat poimintoja informanttien spontaanista puheesta.

DMA-aineisto pohjautuu alun perin paperimuotoiseen Muoto-opin arkistoon.

Lause-esimerkit ovat Kielipankin kautta avoimesti saatavilla konkordanssipalvelu Korpissa ilman kirjautumista. Sanaliput ovat saatavissa luvan hakeneille käyttäjille.

Etsi viittauksia aineistoon Google Scholar -palvelusta.

In English

Raja-Karjalan korpus (FINKA)

Viimeisimmät versiot: 
Raja-Karjalan korpus, Kielipankin LAT-versio (LAT-palvelussa; tämä versio poistuu marraskuussa 2020)
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Viittausohje tähän versioon
Avaa aineisto LAT-palvelussa icon-question-circle
Raja-Karjalan korpuksen ladattava versio
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Viittausohje tähän versioon
Lataa aineisto
Etsi muut saatavilla olevat versiot 

Raja-Karjalan korpus sisältää yhteensä noin 120 tuntia wav-muotoisia äänitiedostoja sekä niiden suomalais-ugrilaisella tarkekirjoituksella tuotetut transkriptiot sekä raakatekstimuodossa että ääneen kohdistettuina TextGrid-tiedostoina, joista on ”riisuttu” tarkemerkit. TextGrid-muotoisissa annotaatiotiedostoissa eri puhujien puheenvuorot on merkitty eri kerroksiin.

Litterointimerkkien kuvaus (pdf)

Äänitteet edustavat 1800-luvun lopulla ja 1900-luvun alussa syntyneiden rajakarjalaisten haastattelupuhetta, jota on tallennettu Kotimaisten kielten keskuksen Suomen kielen nauhoitearkiston kokoelmiin pääosin 1960- ja 1970-luvuilla. Näytteet edustavat Ilomantsin, Korpiselän, Suojärven, Suistamon, Impilahden ja Salmin pitäjien murretta.

Aineistosta on tarjolla toistaiseksi kaksi versiota. Aineistoa voi kuunnella ja litteraateista voi tehdä hakuja Kielipankin LAT-palvelussa. LAT-palvelusta voi myös ladata yksittäisten haastattelujen (”sessioiden”) tiedostoja niputettuina omalle koneelle. Aineistosta on myös saatavilla kokonaan omalle koneelle ladattava versio.

Tarkempaa tietoa eri aineistoversioiden sisällöstä löytyy niiden kuvailutiedoista.

Tietoa tämän aineiston LAT-version poistumisesta marraskuussa 2020

Kielipankin LAT-alusta poistuu käytöstä marraskuun 2020 aikana. Sen jälkeen tätä aineistoa ei enää pääse käyttämään LAT-näkymän kautta. Kaikki tähän aineistoon kuuluva LATissa ollut sisältö on kuitenkin saatavilla ladattavassa muodossa. Aineiston tutkimista ja käsittelyä voi siis edelleen jatkaa esimerkiksi ELAN-ohjelmalla.

Suomeksi

Plenary Sessions of the Parliament of Finland

The latest versions:  
Plenary Sessions of the Parliament of Finland, Kielipankki Korp-versio 1.5
icon-info-circle Metadata and license
icon-quote-right Citation instructions for this version
Open the corpus in Korp icon-question-circle
Plenary Sessions of the Parliament of Finland, Downloadable Version 1
icon-info-circle Metadata and license
icon-quote-right Citation instructions for this version
Download the corpus
Locate other versions of the same resource  

Plenary Sessions of the Parliament of Finland contains audio and video recordings of the parliamentary sessions and the transcripts that have been aligned with the audio. Both the media files and the original transcripts have been obtained directly from the online public services of the Parliament. The content is openly available via the Language Bank of Finland without logging in.

Via the Korp service in the Language Bank of Finland, it is possible to perform various kinds of content searches on the corpus and to calculate statistics from the results. The turns of different speakers have been separated in the text. In the Extended search tab in Korp, it is possible to delimit searches on the basis of the speaker’s name, the parliamentary group or the role of the speaker.

In the search results of this corpus version in Korp, there are also links to the corresponding utterances in the original video. If you wish, you may download the ELAN/EAF annotation files and the audio files in the downloadable version of the corpus for further processing. Moreover, the original videos and transcripts can also be located in the online services of the Parliament of Finland.

The text in the original transcripts has been aligned with the audio recordings by automatic methods. The technological expertise in the alignment process was provided by Aalto University. In those audio portions where a matching text was not found in the transcript, an automatic speech recognizer was used in order to provide a tentative transcript. Thus, it is important to remember that the text in the Korp version of the corpus is not error-free and it may not always fully correspond to the original transcript.

Further information about the contents of the different corpus versions can be found in their metadata records.

Hae Kielipankki-portaalista:
Mila OivaKuukauden tutkija: Mila Oiva

 

Yhteystiedot

Kielipankin tekninen ylläpito:
kielipankki (ät) csc.fi
p. 09 4572001

Aineistoihin ja muuhun sisältöön liittyvät asiat:
fin-clarin (ät) helsinki.fi
p. 029 4144036 / 029 4129317