Donera Prat: The Corpus of Donated Finland-Swedish Speech (doneraprat) is a collection of speech recordings that accumulated during the Donera Prat campaign that was running during 29.11.2021-5.3.2024. Donera Prat was the Swedish counterpart of the Finnish Lahjoita Puhetta (Donate Speech) campaign. The Donera Prat resource is now available under restricted terms and conditions for researchers via the download service of the Language Bank of Finland.
The Donera Prat corpus contains a total of about 89 hours of speech audio recordings, all of which have been manually transcribed into plain text files. The resource also includes information about the elicitation tasks for which each of the speech samples was donated in the original campaign, and the background details that were voluntarily provided by speech donors.
Access to the Puhelahjat resource may be granted for purposes related to language research or to the research and development of AI (artificial intelligence). Academic researchers can now apply for access to the dataset. For academic research use, the license terms and conditions (including the data protection terms and conditions) can be found at http://urn.fi/urn:nbn:fi:lb-2024111128.
Researchers can now apply for access via the Language Bank Rights system. The researcher must present a research plan before the license can be granted. As the resource contains personal data, the researcher must also submit the link of a public privacy notice regarding the research purpose.
In parallel to the license for research use, a license agreement will be offered for companies who wish to use the data. The details and instructions regarding commercial use will soon be available online. Interested companies may request further information at lahjoita-puhetta@helsinki.fi.
Donera Prat: Suomenruotsin lahjoitettu puheaineisto (doneraprat) on kokoelma ruotsinkielisiä puhenäytteitä, jotka lahjoitettiin Donera Prat -kampanjassa aikavälillä 29.11.2021-5.3.2024. Donera Prat oli suomenkielisen Lahjoita Puhetta -kampanjan ruotsinkielinen vastine. Aineisto on nyt rajoitetusti tutkijoiden saatavilla Kielipankin latauspalvelussa.
Lahjoita puhetta -aineisto sisältää noin 89 tuntia puheäänitteitä. Kaikki ääninäytteet on myös käsin litteroitu tekstitiedostoihin. Aineistossa on mukana myös tiedot kampanjasovelluksessa kuhunkin puhenäytteeseen liittyneistä tehtävistä sekä puhettaan lahjoittaneiden ihmisten vapaaehtoisesti ilmoittamat taustatiedot.
Tutkijat voivat nyt hakea pääsyä Donera Prat -aineistoon. Aineistoa voidaan luovuttaa Kielipankista tarkoituksiin, jotka liittyvät kielentutkimukseen tai tekoälyn tutkimukseen ja kehittämiseen. Akateemisen tutkimuskäytön osalta aineiston käyttöehdot ja tietosuojaehdot löytyvät osoitteesta http://urn.fi/urn:nbn:fi:lb-2024111129.
Tutkijat voivat hakea lisenssin mukaisilla ehdoilla henkilökohtaista käyttöoikeutta aineistoon Kielipankin oikeudet -palvelun kautta. Ennen lisenssin myöntämistä tutkijan on esitettävä tutkimussuunnitelma. Koska Puhelahjat-aineisto sisältää henkilötietoja, on tutkijan toimitettava hakemuksensa yhteydessä myös linkki kyseistä tutkimustarkoitusta koskevaan julkiseen tietosuojailmoitukseen.
Tutkijalisenssin rinnalla yrityksille tarjotaan omaa lisenssisopimusta. Tästä tulee myöhemmin lisätietoa omalle sivulleen. Kiinnostuneet yritykset voivat ottaa yhteyttä osoitteeseen lahjoita-puhetta@helsinki.fi.
Oracc 2024 (Open Richly Annotated Cuneiform Corpus, Korp-versio, marraskuu 2024) on nyt käytettävissä Korpissa julkaisuehdokkaana aiempien versioiden rinnalla (Oracc 2021 ja Oracc 2019).
Oracc 2024 sisältää useita uusia osakorpuksia (Oracc-projekteja), ja monet osakorpukset sisältävät enemmän dataa kuin Oracc 2021. Huomaa kuitenkin, että Oracc 2024 ei sisällä osakorpuksia CTIJ, LaOCOST ja RIAo, jotka ovat Oracc 2021:ssä, ja että jotkin osakorpukset sisältävät vähemmän dataa kuin niiden vastineet Oracc 2021:ssä tai Oracc 2019:ssä.
Katso lisätiedot aineistoryhmän sivulta.
Oracc 2024 (Open Richly Annotated Cuneiform Corpus, Korp version, November 2024) is now available in Korp as a release candidate alongside the previous versions (Oracc 2021 and Oracc 2019).
Oracc 2024 contains several new subcorpora (Oracc projects), and many subcorpora contain more data than Oracc 2021. However, note that Oracc
2024 does not contain the subcorpora CTIJ, LaOCOST and RIAo present in Oracc 2021 and that some subcorpora contain less data than their counterparts in Oracc 2021 or Oracc 2019.
Read more on the resource group page.
Shortname | Name and metadata | License | Location | Cite | Resource group and help | Apply | Publication year | Support level |
---|---|---|---|---|---|---|---|---|
Shortname | Name and metadata | License | Location | Cite | Resource group and help | Apply | Publication year | Support level |
These resource versions are not yet available in the Language Bank of Finland.
Shortname | Name and metadata | License | Formats | Support level | Contact Person | Resource group and help | Location | Other information |
---|---|---|---|---|---|---|---|---|
Shortname | Name and metadata | License | Formats | Support level | Contact Person | Resource group and help | Location | Other information |
Open Richly Annotated Cuneiform Corpus (Oracc) brings together the work of several Assyriological projects to publish online editions of cuneiform texts. The Korp version of Oracc allows extensive searches on the texts and presents the results as a KWIC concordance list. Korp also offers statistical information and comparison of the search results. Downloading the query results is possible as well.
The second column in the list indicates if the text has been lemmatized in Oracc.
For how to use Oracc in Korp, please see the Oracc in Korp user guide.
This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2019111601
Lyhenne | Nimi ja kuvailutiedot | Lisenssi | Sijainti | Viite | Aineistoryhmä ja ohje | Hae käyttöoikeutta | Julkaisuvuosi | Tukitaso |
---|---|---|---|---|---|---|---|---|
Lyhenne | Nimi ja kuvailutiedot | Lisenssi | Sijainti | Viite | Aineistoryhmä ja ohje | Hae käyttöoikeutta | Julkaisuvuosi | Tukitaso |
Nämä aineistoversiot eivät vielä ole saatavilla Kielipankin kautta.
Lyhenne | Nimi ja kuvailutiedot | Lisenssi | Muoto | Tukitaso | Contact Person | Sijainti | Aineistoryhmä ja ohje | Muu tieto |
---|---|---|---|---|---|---|---|---|
Lyhenne | Nimi ja kuvailutiedot | Lisenssi | Muoto | Tukitaso | Contact Person | Sijainti | Aineistoryhmä ja ohje | Muu tieto |
Open Richly Annotated Cuneiform Corpus (Oracc) on nuolenpäätekstien verkkoversioiden kokoelma, joka on syntynyt useiden assyriologisten hankkeiden työn tuloksena. Oracc-aineiston Korp-versioissa teksteistä voi tehdä laajoja hakuja ja saada tulokset KWIC-konkordanssilistauksina, jotka voi ladata omalle koneelle. Korpilla voi myös kerätä tilastotietoja ja vertailla hakutuloksia.
Luettelon toisessa sarakkeessa on tieto siitä, onko kyseinen teksti Oracc-aineistossa perusmuotoistettuna.
Kunkin aineistoversion tarkemmat tiedot päivitetään kuvailutietueeseen, joka löytyy pysyvällä tunnisteella (ks. linkki aineiston otsikon kohdalla).
Tämän aineiston versiot ovat saatavilla julkisesti (PUB). Lisenssikuvaketta napauttamalla näet tarkan aineistokohtaisen lisenssin.
Tarkempia ohjeita Oracc-aineiston Korp-versioiden käyttöön löytyy englanninkielisestä ohjeesta Oracc in Korp user guide.
Tämän sivun pysyvä tunniste: http://urn.fi/urn:nbn:fi:lb-2025061821
The following datasets are available for companies and non-academic organizations:
Shortname | Name and metadata | License | Location | Cite | Resource group and help | Apply | Publication year | Support level |
---|---|---|---|---|---|---|---|---|
Shortname | Name and metadata | License | Location | Cite | Resource group and help | Apply | Publication year | Support level |
The following resource versions will be made available later in the Language Bank of Finland for commercial use.
Shortname | Name and metadata | License | Formats | Support level | Contact Person | Resource group and help | Location | Other information |
---|---|---|---|---|---|---|---|---|
Shortname | Name and metadata | License | Formats | Support level | Contact Person | Resource group and help | Location | Other information |
The details of each version of the resource are maintained in the metadata record, findable via the persistent identifier (see the link at the resource title).
The resource will be made available via the download service of the Language Bank of Finland, where even companies and non-academic organizations will be able to access them under restricted license terms and conditions.
The services of the Language Bank are directed at academic researchers. For companies and non-academic organizations, access to Donera Prat datasets may be acquired for a fee.
Further information can be requested by email at lahjoita-puhetta@helsinki.fi.
NB: The Donera Prat dataset is not yet available for commercial use. The instructions and pricing will be updated on this page.
In accordance with the specific terms and conditions of the Donera Prat resource, it is also possible to grant access to the data for commercial and non-academic purposes. However, in this case, a separate license agreement between the University of Helsinki and the company or organization is required. When the agreement is signed and the payment has been made, access can be granted to the representative authorized by the user organization.
When applying for the use of paid material, it must be shown that the license fee has been paid.
A brief summary of the metadata of the recordings included in the dataset can be found here.
This page has a persistent identifier: http://urn.fi/urn:nbn:fi:lb-2024111126
Oletko tutkija? Lahjoita puhetta -aineistot akateemiseen tutkimuskäyttöön löytyvät toiselta sivulta.
Tästä aineistosta tarjotaan yritysten ja ei-akateemisten organisaatioiden käyttöön seuraavat paketit:
Lyhenne | Nimi ja kuvailutiedot | Lisenssi | Sijainti | Viite | Aineistoryhmä ja ohje | Hae käyttöoikeutta | Julkaisuvuosi | Tukitaso |
---|---|---|---|---|---|---|---|---|
Lyhenne | Nimi ja kuvailutiedot | Lisenssi | Sijainti | Viite | Aineistoryhmä ja ohje | Hae käyttöoikeutta | Julkaisuvuosi | Tukitaso |
Nämä aineistoversiot ovat tulossa myöhemmin Kielipankin kautta saataville yritysten ja ei-akateemisten organisaatioiden käyttöön.
Lyhenne | Nimi ja kuvailutiedot | Lisenssi | Muoto | Tukitaso | Contact Person | Sijainti | Aineistoryhmä ja ohje | Muu tieto |
---|---|---|---|---|---|---|---|---|
Lyhenne | Nimi ja kuvailutiedot | Lisenssi | Muoto | Tukitaso | Contact Person | Sijainti | Aineistoryhmä ja ohje | Muu tieto |
Kunkin aineistoversion tarkemmat tiedot päivitetään kuvailutietueeseen, joka löytyy pysyvällä tunnisteella (ks. linkki aineiston otsikon kohdalla).
Aineisto tulee myöhemmin saataville tiedostopaketteina Kielipankin latauspalveluun, josta myös luvan hankkineet yritykset ja ei-akateemiset organisaatiot pääsevät niitä käyttämään.
Kielipankin palvelut on lähtökohtaisesti suunnattu vain tutkijoille. Yrityksille ja ei-akateemisille organisaatioille aineiston käyttö on näyteaineistoa lukuunottamatta maksullista.
Lisätietoja saa osoitteesta lahjoita-puhetta@helsinki.fi.
Huom. Suomenruotsin aineisto ei vielä ole saatavilla yrityksille. Maksullista aineistoa koskevat tiedot päivitetään myöhemmin.
Donera prat -aineiston käyttöehtojen mukaisesti käyttöoikeuksia voidaan myöntää myös yrityksille tai ei-akateemisille organisaatioille. Kunkin ei-akateemisen käyttäjätahon kanssa tehdään kirjallinen sopimus halutun aineiston käytöstä. Kun sopimuksen mukaiset velvoitteet on suoritettu, pääsy aineistoon voidaan myöntää yrityksen valtuuttamalle edustajalle.
Lyhyt yhteenveto aineistoon sisältyvien tallenteiden metatiedoista löytyy täältä.
Tämän sivun pysyvä tunniste: http://urn.fi/urn:nbn:fi:lb-2024111127
Title of the Resource: Corpus for the study of Language and Gender in Mexico and Spain
Metadata: urn:nbn:fi:lb-2024030603
License: urn:nbn:fi:lb-2024030605
This page describes the specific conditions regarding the processing of the personal data in this Resource. In addition to these conditions, see the guidelines for processing personal data in the Language Bank of Finland.
University of Helsinki
PO Box 3
00014 University of Helsinki
Phone: 02941 911
For further details on the data protection of the resources in the Language Bank of Finland, please contact FIN-CLARIN helpdesk.
Data Protection Officer of the University of Helsinki
Email: tietosuoja@helsinki.fi
The database contains the following personal data on the informants:
– age group (30-40 or 60-70)
– gender (female, male, other)
– nationality/city of origin (Spain/Valencia, Mexico/Guadalajara)
– sexual orientation (straight, gay, lesbian, bi, other)
The audio recordings contain the speech of the informants and interviewers. Both the audio recordings and the textual transcripts have been pseudonymised by removing the names of persons, places, schools, workplaces, etc. from which individuals could be identified.
The interview material contains information on the informants’ living environment, hobbies, personality and appearance, and their views regarding gender equality and gender-related language and communication.
The informants in the CoLaGe-V and CoLaGe-G subcorpora are native speakers of Spanish or Mexican Spanish living in the Valencia or Guadalajara region, belonging to the 30-40 or 60-70 age groups, and representing middle-class socioeconomic backgrounds.
The informants in the CoLaGe-D subcorpus also represent a gender and/or sexual minority.
In these data protection terms and conditions, End-User means the party acting as the Controller for the Resource received, in accordance with the General Data Protection Regulation (EU) 2016/679. Depending on the case and the purpose of Resource use, End-User may therefore mean the CLARIN service user’s employer or organisation (e.g., a university, university of applied sciences or other research organisation) or the service user personally.
The End-User understands that when receiving the Resource, it becomes a Controller, as referred to in the data protection legislation. The End-User must ensure that it complies with the applicable data protection legislation when processing personal data.
The material may not be used to identify speakers.
When you start using this Resource, share the title of your project that is understandable to the general public as well as the link to the publicly available privacy notice (see instructions). This information will be published on the website of the Language Bank of Finland.
The resource will no longer contain personal data after the year 2100.
Persistent identifier of this page: urn:nbn:fi:lb-2025061221
Aineiston nimi: Korpus kielen ja sukupuolen tutkimiseen Meksikossa ja Espanjassa (colage)
Aineiston kuvailutiedot: urn:nbn:fi:lb-2024030603
Lisenssi: urn:nbn:fi:lb-2024030606
Aineisto sisältää henkilötietoja, joiden käsittelyä koskevat erityisehdot on kuvattu tällä sivulla. Tutustu lisäksi henkilötietoja sisältävien Kielipankin aineistojen käsittelyohjeisiin.
Helsingin yliopisto
PL 3
00014 Helsingin yliopisto
Puhelin: 02941 911
Lisätietoja Kielipankin aineistojen tietosuojasta voit pyytää FIN-CLARINin asiakaspalvelusta.
Helsingin yliopiston tietosuojavastaava
Sähköpostiosoite: tietosuoja@helsinki.fi
Aineisto sisältää seuraavat henkilötiedot informanteista:
– ikäryhmä (30–40 tai 60–70)
– sukupuoli (nainen, mies, muu)
– kansalaisuus/asuinkaupunki (Espanja/Valencia, Meksiko/Guadalajara)
– seksuaalinen suuntautuminen (hetero, homo, lesbo, bi, muu)
Äänitteet sisältävät informanttien ja haastattelijoiden puheääntä. Sekä äänitteet että niistä tehdyt tekstimuotoiset litteraatit on pseudonymisoitu poistamalla henkilöiden, paikkojen, koulujen, työpaikkojen jne. nimet, joista yksittäisiä henkilöitä voisi tunnistaa.
Haastatteluaineistossa on tietoja informanttien asuinympäristöstä, harrastuksista, persoonallisuudesta ja ulkonäöstä, sukupuolten tasa-arvoa sekä sukupuoleen liittyvää kielenkäyttöä ja viestintää koskevista näkemyksistä.
Informantit alakorpuksissa CoLaGe-V ja CoLaGe-G ovat syntyperäisiä Espanjan tai Meksikon espanjan puhujia, jotka asuvat Valencian tai Guadalajaran alueella, kuuluvat ikäryhmiin 30–40 tai 60–70 ja edustavat keskiluokkaista sosioekonomista taustaa.
Informantit alakorpuksessa CoLaGe-D edustavat lisäksi jotakin sukupuoli- ja/tai seksuaalivähemmistöä.
Käyttäjällä tarkoitetaan näissä tietosuojaehdoissa sitä tahoa, joka toimii vastaanotettavan aineiston rekisterinpitäjänä yleisen tietosuoja-asetuksen (EU) 2016/679 mukaan. Käyttäjä voi siis tapauksesta ja aineiston käyttötarkoituksesta riippuen olla Kielipankin käyttäjän työnantaja tai organisaatio, jossa hän toimii (esimerkiksi yliopisto, ammattikorkeakoulu tai muu tutkimusorganisaatio) tai palvelun käyttäjä henkilökohtaisesti.
Käyttäjä ymmärtää, että aineistoa vastaanottaessaan siitä tulee soveltuvan tietosuojalainsäädännön mukaan rekisterinpitäjä. Käyttäjä on vastuussa siitä, että se noudattaa henkilötietojen käsittelyssä soveltuvaa tietosuojalainsäädäntöä.
Aineistoa ei saa käyttää puhujien henkilöllisyyden tunnistamiseen.
Kun ryhdyt käyttämään tätä Aineistoa, ilmoita oman hankkeesi yleistajuinen otsikko sekä avoimesti saatavilla olevan tietosuojaselosteen linkki Kielipankille (ks. ohjeet). Ilmoitetut tiedot julkaistaan Kielipankin verkkosivuilla.
Aineisto ei sisällä henkilötietoja enää vuoden 2100 jälkeen.
Tämän sivun pysyvä tunniste: urn:nbn:fi:lb-2025061222
Muinaisen Lähi-idän imperiumit -huippuyksikön (ANEE) ryhmä 1 on luonut uuden joukon sanaverkostoja.
Uusbabylonialaiset sanaverkostot
Kuvailutiedot: http://urn.fi/urn:nbn:fi:lb-2025052002
Avaa verkkosivusto
Uusbabylonialaiset sanaverkostot – tietoaineisto
Kuvailutiedot:http://urn.fi/urn:nbn:fi:lb-2025052003
Avaa verkkosivusto
Lisätiedot löytyvät ANEE:n aineistoryhmäsivulta.
Team 1 of the Centre of Excellence in Ancient Near Eastern Empires (ANEE) has created a new set of lexical networks.
The Neo-Babylonian Lexical Networks
Metadata: http://urn.fi/urn:nbn:fi:lb-2025052002
Open the website
Neo-Babylonian Lexical Networks – the dataset
Metadata: http://urn.fi/urn:nbn:fi:lb-2025052003
Open the website
More information can be found on the ANEE resource group page.
Lyhenne | Nimi ja kuvailutiedot | Lisenssi | Sijainti | Viite | Aineistoryhmä ja ohje | Hae käyttöoikeutta | Julkaisuvuosi | Tukitaso |
---|---|---|---|---|---|---|---|---|
Lyhenne | Nimi ja kuvailutiedot | Lisenssi | Sijainti | Viite | Aineistoryhmä ja ohje | Hae käyttöoikeutta | Julkaisuvuosi | Tukitaso |
Nämä aineistoversiot eivät vielä ole saatavilla Kielipankin kautta.
Lyhenne | Nimi ja kuvailutiedot | Lisenssi | Muoto | Tukitaso | Contact Person | Sijainti | Aineistoryhmä ja ohje | Muu tieto |
---|---|---|---|---|---|---|---|---|
Lyhenne | Nimi ja kuvailutiedot | Lisenssi | Muoto | Tukitaso | Contact Person | Sijainti | Aineistoryhmä ja ohje | Muu tieto |
Kunkin aineistoversion tarkemmat tiedot päivitetään kuvailutietueeseen, joka löytyy pysyvällä tunnisteella (ks. linkki aineiston otsikon kohdalla).
Lyhyt yhteenveto aineistoon sisältyvien tallenteiden metatiedoista löytyy täältä.
Litteroijille annetut ohjeet (pdf)
Tämän sivun pysyvä tunniste: http://urn.fi/urn:nbn:fi:lb-2024111124
Donera Prat datasets for commercial use: see further details on another page
Shortname | Name and metadata | License | Location | Cite | Resource group and help | Apply | Publication year | Support level |
---|---|---|---|---|---|---|---|---|
Shortname | Name and metadata | License | Location | Cite | Resource group and help | Apply | Publication year | Support level |
These resource versions are not yet available in the Language Bank of Finland.
Shortname | Name and metadata | License | Formats | Support level | Contact Person | Resource group and help | Location | Other information |
---|---|---|---|---|---|---|---|---|
Shortname | Name and metadata | License | Formats | Support level | Contact Person | Resource group and help | Location | Other information |
Further details of each version of the resource are maintained in the metadata record, findable via the persistent identifier (see the link at the resource title).
A brief summary of the metadata of the recordings included in the dataset can be found here.
Instructions given to the transcribers (pdf; in Finnish)
This page has a persistent identifier: http://urn.fi/urn:nbn:fi:lb-2024111123
Aineiston nimi: Donera Prat: Suomenruotsin lahjoitettu puheaineisto (doneraprat)
Aineiston kuvailutiedot: urn:nbn:fi:lb-2024111121
Lisenssi: urn:nbn:fi:lb-2024111129
Tämä Aineisto sisältää henkilötietoja, joiden käsittelyä koskevat erityisehdot on kuvattu tällä sivulla. Tutustu lisäksi henkilötietoja sisältävien Kielipankin aineistojen käsittelyohjeisiin.
Helsingin yliopisto
PL 3
00014 Helsingin yliopisto
Puhelin: 02941 911
Lisätietoja Kielipankin aineistojen tietosuojasta voit pyytää FIN-CLARINin asiakaspalvelusta.
Helsingin yliopiston tietosuojavastaava
Sähköpostiosoite: tietosuoja@helsinki.fi
Alkuperäinen Aineisto koostuu puheäänitteistä, äänitteiden tallennukseen liittyvistä teknisistä oheistiedoista sekä puhettaan lahjoittaneiden henkilöiden vapaaehtoisesti antamista taustatiedoista. Kuhunkin äänitallenteeseen voi liittyä myös puheen sanallisen sisällön tekstimuotoinen kuvaus eli litteraatti sekä muita kuvauksia ja merkkauksia, joita on tuotettu käsin tai koneellisesti.
Aineistoon kuuluvat äänitteet ovat alkuperäisen sisältönsä osalta muokkaamattomia, vaikka äänitiedostojen tallennusformaatti saattaa käytännön syistä vaihdella. Joissakin tapauksissa puhujan henkilöllisyys voi käydä ilmi joko suoraan tai epäsuorasti esimerkiksi hänen oman puheäänensä tai äänitteessä mainittujen asioiden perusteella. Aineistoa ei kuitenkaan saa käyttää puhujien henkilöllisyyden selvittämiseen.
Äänitteiden oheistietoihin sisältyvät
Tekniset oheistiedot on tallennettu Aineistoon karkealla tasolla siten, että laitetietojen perusteella ei voi selvittää tallenteen tekijän tai laitteen käyttäjän henkilöllisyyttä.
Puheen lahjoittajien vapaaehtoisesti antamiin taustatietoihin kuuluu seuraavia tietoja:
Taustatietojen oikeellisuutta ei ole mahdollista jälkikäteen tarkistaa. Puheen lahjoittajat ovat voineet halutessaan jättää taustatietokysymyksiä väliin tai he ovat saattaneet antaa niihin vääriä tietoja. Vapaatekstinä kirjoitettavat vastaukset on voinut antaa haluamallaan tarkkuudella. Jos puhetta on lahjoitettu samalla laitteella useita kertoja, lahjoittaja on voinut antaa samoihin taustatietokysymyksiin useita erilaisia vastauksia.
Rekisteröidyt ovat Lahjoita puhetta –kampanjaan osallistuneita henkilöitä, jotka ovat vapaaehtoisesti lahjoittaneet puhettaan ja valitsemiaan taustatietoja.
Käyttäjällä tarkoitetaan näissä tietosuojaehdoissa sitä tahoa, joka toimii vastaanotettavan Aineiston rekisterinpitäjänä yleisen tietosuoja-asetuksen (EU) 2016/679 mukaan. Käyttäjä voi siis tapauksesta ja Aineiston käyttötarkoituksesta riippuen olla Kielipankin käyttäjän työnantaja tai organisaatio, jossa hän toimii (esimerkiksi yliopisto, ammattikorkeakoulu tai muu tutkimusorganisaatio) tai palvelun käyttäjä henkilökohtaisesti.
Käyttäjä ymmärtää, että Aineistoa vastaanottaessaan siitä tulee soveltuvan tietosuojalainsäädännön mukaan rekisterinpitäjä. Käyttäjä on vastuussa siitä, että se noudattaa henkilötietojen käsittelyssä soveltuvaa tietosuojalainsäädäntöä.
Käyttäjän on ilmoitettava viivytyksettä Kielipankille, jos se havaitsee tai epäilee, että Aineisto sisältää:
Käyttäjän tulee liittää ilmoitukseen tiedot, joiden avulla Kielipankki voi tunnistaa kyseisen äänitteen.
Kielipankki voi tuottaa Aineistosta uusia versioita esimerkiksi sen varmistamiseksi, että tietosuojalainsäädännön mukaiset rekisteröidyn oikeudet toteutetaan ja Aineisto ei sisällä lainvastaista sisältöä. Kun Kielipankki tuottaa Aineistosta uuden version ja ilmoittaa siitä sähköpostitse Käyttäjälle, Käyttäjän on viivytyksettä poistettava vanha versio Aineistosta ja korvattava se uudella. Käyttäjän on toimitettava Kielipankille toimiva ja ajantasainen sähköpostiosoitteensa, johon ilmoitetaan Aineiston päivityksistä.
Kun ryhdyt käyttämään tätä Aineistoa, ilmoita oman hankkeesi yleistajuinen otsikko sekä avoimesti saatavilla olevan tietosuojaselosteen linkki Kielipankille tällä lomakkeella. Ilmoitetut tiedot julkaistaan Kielipankin verkkosivuilla.
Tämän sivun pysyvä tunniste: urn:nbn:fi:lb-2024111131
Title of Resource: Donera Prat: The Corpus of Donated Finland-Swedish Speech (doneraprat)
Metadata: urn:nbn:fi:lb-2024111121
License: urn:nbn:fi:lb-2024111128
This page describes the specific conditions regarding the processing of the personal data in the Resource. In addition to these conditions, see the guidelines for processing personal data in the Language Bank of Finland.
University of Helsinki
PO Box 3
00014 University of Helsinki
Phone: 02941 911
For further details on the data protection of the resources in the Language Bank of Finland, please contact the helpdesk of the Language Bank.
Data Protection Officer of the University of Helsinki
Email: tietosuoja@helsinki.fi
The original Resource consists of audio recordings of speech, technical metadata regarding the recording process, and answers that were voluntarily given by the speech donors to a set of non-mandatory background questions. Each piece of recorded audio may also be supplemented with a transcript of the speech content and other descriptions and mark-up that may be created manually or automatically.
The recordings included in the Resource have not been edited with respect to their original content, although the technical format of the audio files may vary due to practical reasons. In some cases, the identity of the speaker may become evident either directly or indirectly, for instance due to their speaking voice or due to some of the content mentioned in the recording. However, the Resource may not be used for identifying speakers.
The technical metadata includes the following types of information:
The technical metadata have been collected and included in the Resource on a coarse level. It is not possible to reveal the identity of the speech donor or the user of the device on the basis of the technical information.
The background details provided by the speech donors include the following:
It is not possible to verify the correctness of the background information mentioned above. The speech donors may have chosen to skip background questions or to submit false information. The free text answers could be provided at the desired level of detail. In case speech was donated several times via the same device, the donor may have given several different answers to the same background questions.
The data subjects are volunteers who participated in the Donate Speech campaign (Lahjoita puhetta) by donating their speech and the background details of their choice.
In these data protection terms and conditions, End-User means the party acting as the Controller for the Resource received, in accordance with the General Data Protection Regulation (EU) 2016/679. Depending on the case and the purpose of Resource use, End-User may therefore mean the Language Bank user’s employer or organisation (e.g., a university, university of applied sciences or other research organisation) or the service user personally.
The End-User understands that when receiving the Resources, it becomes a controller, as referred to in the data protection legislation. The End-User must ensure that it complies with the applicable data protection legislation when processing personal data.
The End-User shall notify the Language Bank without delay if it identifies or suspect the presence of the following content in the Resource:
The notification made by the End-User shall include information that enables the Language Bank to identify the relevant recording.
The Language Bank may produce new versions of the Resource to ensure, for example, that the rights of data subjects in accordance with Data Protection Legislation are fulfilled and that there is no unlawful content in the Resource. When the Language Bank produces a new version of the Resource and notifies the contact person of the End-User by email, the End-User shall, without delay, delete the old version of the Resource and replace it with the new version. The End-User must submit a functional and valid email address to the Language Bank to which notifications of updates to the Resource are to be sent.
When you start using this Resource, share the title of your project that is understandable to the general public as well as the link to the publicly available privacy notice by using this form. This information will be published on the website of the Language Bank of Finland.
Persistent identifier of this page: urn:nbn:fi:lb-2024111130
The text below on this page is a copy of the ”General Terms of Speech Material Use” that are included in the agreement made with a company or an organization regarding the use of the ”Speech Material”.
Definitions used in the text:
Speech Material = According to the agreement, one of the following:
Donera Prat: The Corpus of Donated Finland-Swedish Speech, Complete dataset, version 1, URN: urn:nbn:fi:lb-2024111121
Donera Prat: The Corpus of Donated Finland-Swedish Speech, Sample, URN: urn:nbn:fi:lb-2025052721
The Language Bank = University of Helsinki
Licensee = The company or the organization with which the Agreement was signed
1.1. “Speech Material” refers to material collected in the Donera Prat campaign, as defined in the signature part of this Agreement, which the Language Bank distributes for the purpose of research and development of applications and services that are capable of interpreting and producing speech, as well as for the purpose of language research.
“Data Protection Legislation” refers to the EU General Data Protection Regulation (2016/679) (“GDPR”) or any subsequent law that supersedes it, and the national data protection legislation applicable to the Licensee. This Agreement refers to terms that have been defined in the GDPR, including “personal data”, “data subject”, “controller”, “processing” and “processor”. In this Agreement, they are given the same meaning as in the GDPR.
2.1. The Language Bank hereby grants the Licensee a non-exclusive, non-transferable and non-sublicensable license to use to the Speech Material for the purpose of research and development of applications and services that are capable of interpreting and producing speech in accordance with the terms specified in this Agreement.
The license is valid for as long as this Agreement remains in force.
2.2. The license only applies to the Licensee defined in the signature part of this Agreement. Disclosing or transferring the Speech Material to a third party (including to a company affiliated with the Licensee) is prohibited, except as set forth in Section 4.3.
The Language Bank retains proprietary rights to the Speech Material.
2.3. For the avoidance of doubt, any results created by the Licensee (such as software and models) from which the Speech Material, the personal data included in the Speech Material, and the voices of the speakers cannot be restored shall belong to the Licensee, and the Licensee may continue to use such results after the term of the license.
The Language Bank shall provide a copy of the Speech Material to the Licensee after the Licensee has paid the fee set forth in the signature part of this Agreement.
2.4. The Licensee must comply with the data protection terms and conditions presented in Section 4 of this Agreement when processing the Speech Material.
The Licensee must use the Speech Material in accordance with good practice while respecting equality and human rights. The use of the Speech Material for discriminatory purposes or purposes that are derogatory to a specific group of people is prohibited.
3.1. The Licensee shall pay the license fee set forth in the signature part of the Agreement.
4.1. The Licensee understands that the Speech Material includes personal data subject to Data Protection Legislation. When processing the Speech Material, the Licensee is considered the controller. The Licensee undertakes to process the Speech Material in accordance with Data Protection Legislation solely for the purpose determined in Section 2.1 of this Agreement. The Licensee shall comply with any obligations imposed on the controller by Data Protection Legislation in the processing of the Speech Material.
The data included in the Speech Material are confidential. The Licensee must implement any technical and organisational measures required to ensure that only the relevant persons have access to the Speech Material. Employees of the Licensee who process the Speech Material must be bound by an obligation of confidentiality pertaining to the content of the Speech Material. The confidentiality obligation must remain in effect after the end of the employment relationship.
4.2. The Licensee shall not disclose or provide access to the Speech Material to any third party. Publication of the Speech Material is prohibited. Notwithstanding the aforementioned, the Licensee may transfer the Speech Material to its subcontractors or service providers that act as processors of personal data for purposes consistent with this Agreement. When employing processors, Licensee shall comply with the requirements of Data Protection Legislation regarding processors of personal data, and conclude an agreement on the processing of personal data in accordance with Article 28 of the GDPR with the processors. If the processors process personal data outside the European Economic Area, the Licensee shall comply with the provisions of Chapter V of the GDPR on the transfer of personal data to third countries or international organisations. The processing of the Speech Material in cloud-based services aimed at consumers is prohibited.
The Speech Material shall not be used to identify speech donors. Recordings included in the Speech Material must not be combined with personal data available elsewhere, nor may recordings included in the Speech Material be compared to recordings available elsewhere to determine whether the speaker is the same person in both.
4.3. The Licensee shall maintain an up-to-date data protection statement online on the use of the Speech Material. The data protection statement must contain all information which must be supplied to data subjects according to Data Protection Legislation. The Licensee shall submit to the Language Bank the URL address of the statement before commencing the processing of the Speech Material. The Language Bank will publish the URL address on its website.
If the Licensee processes personal data outside the European Economic Area, the Language Bank and the Licensee shall put in place the safeguards required by Chapter V of the GDPR before the disclosure of the Speech Material to the Licensee. The Language Bank has the right to refrain from transferring the Speech Material for processing outside the European Economic Area if it deems that such transfer in accordance with Chapter V of the GDPR is not possible by reasonable means.
4.4. The Licensee shall notify the Language Bank without undue delay if the Speech Material is subjected to a personal data breach which results in the accidental or unlawful destruction, loss, alteration, unauthorised disclosure of, or access to, transferred, stored, or otherwise processed personal data.
The Licensee shall securely delete the Speech Material when it no longer has grounds based on Data Protection Legislation to process the Speech Material. In any event, the Licensee shall delete the Speech Material upon expiration or termination of the license granted in this Agreement. The Licensee shall document the deletion of the Speech Material. The Language Bank has the right to request and receive this documentation and an assurance given by the Licensee indicating that the Speech Material has been deleted.
5.1. The Language Bank may produce new versions of the Speech Material to ensure, for example, that the rights of data subjects in accordance with Data Protection Legislation are fulfilled and that there is no unlawful content in the Speech Material. When the Language Bank produces a new version of the Speech Material and notifies the contact person of the Licensee by email, the Licensee shall, without delay, delete the old version of the Speech Material and replace it with the new version. In accordance with Section 8, the Licensee must submit a functional and valid email address to the Language Bank to which notifications of updates to the Speech Material are to be sent.
The Licensee shall notify the Language Bank without delay if it identifies or suspect the presence of the following content in the Speech Material:
(a) Unauthorised, inaccurate, unnecessary or outdated personal data (such as direct identifiers, including names and contact details, information pertaining to the private life of individuals, rumours or defamatory speech),
(b) Unauthorised copies of works or other objects protected by copyright or related rights,
(c) Trade secrets,
(d) Data whose disclosure would constitute an offence against privacy, public peace or personal reputation (Chapter 24 of the Criminal Code of Finland), incitement to hatred or ethnic agitation (Sections 10 and 10a, Chapter 11 of the Criminal Code of Finland) or another offence, or
(e) Recordings where speech has been recorded without the speaker’s knowledge, or the recording has been started by accident.
The notification made by the Licensee shall include information that enables the Language Bank to identify the relevant recording.
6.1. The Language Bank provides the Speech Material to the Licensee “as is”. The Language Bank provides no warranty on the Speech Material and specifically disclaims any warranties of accuracy, completeness or fitness for a particular purpose, or non-infringement upon the rights of any third parties. The Licensee shall use the Speech Material at its own risk. The Language Bank is not responsible for any damage or losses incurred by the Licensee through the use of the Speech Material.
7.1. The Licensee is solely liable for ensuring that it uses the Speech Material in accordance with Data Protection Legislation and any other applicable legislation.
The Parties shall be liable towards each other for the damage they have caused by a breach of contract. The Language Bank shall not be liable for indirect or consequential damage. In all cases, the total liability of the Language Bank is limited to the amount of the license fee paid by the Licensee to the Language Bank. The above limitations of liability do not apply if the damage was caused wilfully or by gross negligence.
7.2. Neither Party is liable towards the other Party if a failure to fulfil an obligation set out in this Agreement is caused by a force majeure event. Force majeure includes, but is not limited to, fires, floods, explosions, lightning, storms, earthquakes, landslides, shortages of energy supply, interventions by government, revolutions, riots, wars, strikes, labour disputes, transport disruptions, shortages of labour, or another factor beyond the reasonable control of the relevant Party.
8.1. Any notices relating to this Agreement shall be sent by post, courier or email to the relevant Party’s contact person indicated in the signature part of this Agreement. If the contact details of a Party change, the Party shall submit new contact details to the other Party without undue delay.
9.1. The Agreement shall enter into force on the date of the last signature and shall remain in effect for 10 years from the effective date. The Licensee may terminate the Agreement by giving written notice of termination to the Language Bank, in which case the Agreement shall terminate after 30 days have passed from the date of the notice. The Language Bank shall have no obligation to return any fees paid by the Licensee for the license to use the Speech Material.
As stated in Section 4.8 above, the Speech Material must be deleted when there are no legal grounds under the Data Protection Laws for the processing of personal data. During the term of the license to use the Speech Material, the Language Bank shall provide a new copy of the Speech Material to the Licensee upon request and within a reasonable time if the Licensee wishes to resume processing of the Speech Material.
9.2. If a Party materially breaches this Agreement and does not remedy the breach within thirty (30) days of receiving written notice concerning the breach, or if the nature of the breach makes it incapable of being remedied, the other Party may terminate this Agreement. For the avoidance of doubt, failure to pay compensation for the use of the Speech Material and a material breach of the Data Protection Laws shall be considered a material breach of contract.
If a Party is evidently insolvent or becomes subject to bankruptcy, composition, insolvency, administration, administrative receivership or other similar proceedings, the other Party may terminate the Agreement with immediate effect.
9.3. In accordance with Section 4, the license to use to the Speech Material ends immediately at the termination or expiry of the Agreement.
Sections 6, 7, 10 and 11.5 of the Agreement as well as provisions which are intended to remain in effect due to their nature shall remain in effect also after the termination or expiry of the Agreement.
10.1. This Agreement is governed by the laws of Finland excluding its conflict of law provisions.
Any disputes relating to this Agreement, which cannot be solved amicably, shall be resolved by the Helsinki District Court.
10.2. If the Licensee’s registered office is in a country in which a judgment from the courts of Finland would not be enforceable, any disputes arising from the Agreement shall be finally settled by arbitration under the rules of arbitration of the Central Chamber of Commerce of Finland. The arbitral tribunal is composed of a sole arbitrator. The seat of arbitration is Helsinki, Finland. The language of arbitration is Finnish.
11.1. The Language Bank has the right to amend these general terms on legitimate grounds, which may relate to, including but not limited to, instructions given by authorities, best practice, or changes in the Data Protection Laws or other applicable laws. A notification of any changes made shall be sent by email to the contact address provided by the Licensee sixty (60) days before their entry into force. If the Licensee does not accept the changes made to the general terms, it may terminate the Agreement before the entry into force of the amendments by giving written notice to the Language Bank no later than thirty (30) days before their entry into force. The Language Bank shall have no obligation to return any fees paid by the Licensee for the license to use the Speech Material.
The Licensee shall not transfer this Agreement or parts thereof to third parties without the express written consent of the Language Bank.
11.2. This Agreement cancels all prior agreements and together with its appendices represents the entire Agreement between the Parties relating to the subject matter thereof.
If any of the terms of this Agreement are or become invalid, the remainder of the Agreement shall remain valid. If any invalid, unenforceable or illegal provision of this Agreement would be valid, enforceable and legal if some part of it were deleted, the provision shall apply with the minimum modification necessary to make it legal, valid and enforceable.
11.3. Neither Party may use the name or logo of the other Party in product marketing, media releases or for other similar purposes, unless specifically agreed between the Parties in writing. However, the Licensee has the right to refer, as appropriate, to the Donera Prat campaign and the Language Bank as the source of the Speech Material. For the avoidance of doubt, the Language Bank has the right to mention the Licensee as a recipient of the Speech Material on the Lahjoita puhetta data protection webpage, as well as other contexts where mentioning recipients of the Speech Material is necessary for the Language Bank to comply with its obligations.
Persistent Identifier of this page: urn:nbn:fi:lb-2024111132
Alempana tällä sivulla on kopio ”Puheaineiston käytön yleisistä ehdoista”, jotka sisältyvät yrityksen tai organisaation kanssa tehtävään, Puheaineiston käyttöä koskevaan sopimukseen.
Tekstissä käytettävät määritelmät:
Puheaineisto = Sopimuksen mukaisesti jokin seuraavista aineistoista:
Donera Prat: Suomenruotsin lahjoitettu puheaineisto, koko aineisto (versio 1), URN: urn:nbn:fi:lb-2024111121
Donera Prat: Suomenruotsin lahjoitettu puheaineisto, näyte, URN: urn:nbn:fi:lb-2025052721
Kielipankki = Helsingin yliopisto
Lisenssinsaaja = Yritys tai organisaatio, jonka kanssa Puheaineistoa koskeva sopimus on tehty
1.1. ”Puheaineisto” tarkoittaa Donera prat -kampanjassa kerättyä aineistoa, joka on määritelty tarkemmin Sopimuksen allekirjoitusosassa, ja jota Kielipankki välittää puhetta ymmärtävien ja tuottavien sovellusten ja palveluiden tutkimuksen ja kehityksen sekä kielentutkimuksen tarpeisiin.
”Tietosuojalainsäädäntö” tarkoittaa EU:n yleistä tietosuoja-asetusta 2016/679 tai sen tilalle myöhemmin tulevaa tietosuojalainsäädäntöä sekä Lisenssinsaajaan soveltuvaa kansallista tietosuojalainsäädäntöä. Tässä Sopimuksessa käytetään käsitteitä, jotka on määritelty EU:n yleisessä tietosuoja-asetuksessa, esimerkiksi ”henkilötiedot”, ”rekisteröity”, ”rekisterinpitäjä”, ”käsittely” ja ”käsittelijä”. Tällaisia käsitteitä käytetään tässä Sopimuksessa samassa merkityksessä kuin mikä niillä on yleisessä tietosuoja-asetuksessa.
2.1. Kielipankki myöntää Lisenssinsaajalle ei-yksinomaisen, ei-siirrettävän ja ei-alilisensoitavan oikeuden käyttää Puheaineistoa puheentunnistuksen sekä puhetta ymmärtävien ja tuottavien sovellusten ja palveluiden tutkimusta ja kehitystä varten tässä Sopimuksessa tarkemmin määritellyillä ehdoilla.
Käyttöoikeus on voimassa tämän Sopimuksen voimassaolon ajan.
2.2. Käyttöoikeus koskee ainoastaan Sopimuksen allekirjoitusosassa määriteltyä Lisenssinsaajaa. Puheaineiston luovuttaminen tai siirtäminen kolmannelle osapuolelle (mukaan lukien Lisenssinsaajan kanssa samaan konserniin kuuluvalle yhtiölle) on kiellettyä muissa kuin kohdan 4.3 mukaisissa tilanteissa.
Omistusoikeus Puheaineistoon säilyy Kielipankilla.
2.3. Selvyyden vuoksi todetaan, että Lisenssinsaaja omistaa aikaansaamansa tulokset (kuten sovellukset ja mallit), joista Puheaineisto, Puheaineiston sisältämät henkilötiedot ja yksittäisten puhujien äänet eivät ole palautettavissa, ja että Lisenssinsaajalla on oikeus käyttää tällaisia tuloksia myös Puheaineiston käyttöoikeuden päättymisen jälkeen.
Kielipankki luovuttaa Puheaineiston kopion Lisenssinsaajalle, kun Lisenssinsaaja on maksanut Sopimuksen allekirjoitusosassa määritellyn korvauksen.
2.4. Lisenssinsaajan on noudatettava Puheaineiston käsittelyssä tietosuojaehtoja, jotka ovat tämän Sopimuksen kohdassa 4.
Lisenssinsaajan on käytettävä Puheaineistoa hyvän tavan mukaisesti ja yhdenvertaisuutta ja ihmisoikeuksia kunnioittaen. Puheaineiston käyttö syrjivään tai tiettyä ihmisryhmää halventavaan tarkoitukseen on kielletty.
3.1. Lisenssinsaaja maksaa Puheaineiston käyttöoikeudesta Sopimuksen allekirjoitusosassa määritellyn korvauksen.
4.1. Lisenssinsaaja ymmärtää, että Puheaineisto sisältää Tietosuojalainsäädännön mukaan henkilötietoja. Lisenssinsaaja toimii rekisterinpitäjänä käsitellessään Puheaineistoa. Lisenssinsaaja sitoutuu käsittelemään Puheaineistoa Tietosuojalainsäädännön mukaisesti ainoastaan tämän Sopimuksen kohdassa 2.1 määriteltyyn tarkoitukseen. Lisenssinsaajalla on velvollisuus noudattaa Puheaineiston käsittelyssä kaikkia Tietosuojalainsäädännön rekisterinpitäjille asettamia velvoitteita.
Puheaineiston sisältämät tiedot ovat salassa pidettäviä. Lisenssinsaaja toteuttaa asianmukaiset tekniset ja organisatoriset suojatoimet sen varmistamiseksi, että ainoastaan asiaankuuluvat henkilöt pääsevät käsittelemään Puheaineistoa. Lisenssinsaajan henkilöstöllä, joka käsittelee Puheaineistoa, tulee olla Puheaineiston sisältöä koskeva salassapitovelvoite, joka pysyy voimassa myös työsuhteen päättymisen jälkeen.
4.2. Puheaineiston luovuttaminen tai siihen pääsyn antaminen kolmannelle osapuolelle sekä julkaiseminen on kielletty. Lisenssinsaaja saa kuitenkin siirtää aineistoa henkilötietojen käsittelijöinä toimiville alihankkijoilleen tai palveluntarjoajilleen tämän Sopimuksen mukaisiin tarkoituksiin. Käsittelijöitä käytettäessä on noudatettava Tietosuojalainsäädännön vaatimuksia henkilötietojen käsittelijöistä, ja niiden kanssa on tehtävä EU:n yleisen tietosuoja-asetuksen 28 artiklan mukainen sopimus henkilötietojen käsittelystä. Jos käsittelijät käsittelevät henkilötietoja Euroopan talousalueen ulkopuolella, Lisenssinsaajan on noudatettava yleisen tietosuoja-asetuksen V luvun säännöksiä henkilötietojen siirrosta kolmansiin maihin tai kansainvälisille järjestöille. Puheaineiston käsittely kuluttajille suunnatussa pilvipalvelussa on kielletty.
Puheaineistoa ei saa käyttää puheen lahjoittajien henkilöllisyyden tunnistamiseen. Puheaineistoon sisältyviin äänitteisiin ei saa yhdistää muualta saatavilla olevia henkilötietoja, eikä Puheaineistoon sisältyviä äänitteitä saa verrata muualta saatavilla oleviin äänitteisiin sen selvittämiseksi, onko kyse samasta puhujasta.
4.3. Lisenssinsaajan on ylläpidettävä verkossa Puheaineiston käytöstä ajantasaista tietosuojaselostetta, joka sisältää tiedot, jotka on Tietosuojalainsäädännön mukaan toimitettava rekisteröidyille. Lisenssinsaajan on toimitettava Kielipankille selosteen URL-osoite ennen Puheaineiston käsittelyn aloittamista. Kielipankki julkaisee URL-osoitteen verkkosivuillaan.
Jos Lisenssinsaaja käsittelee henkilötietoja Euroopan talousalueen ulkopuolella, Kielipankki ja Lisenssinsaaja toteuttavat yleisen tietosuoja-asetuksen V luvun edellyttämät suojatoimet ennen Puheaineiston siirtämistä Lisenssinsaajalle. Kielipankilla on oikeus pidättäytyä Puheaineiston siirtämisestä käsiteltäväksi Euroopan talousalueen ulkopuolella, mikäli se katsoo, että Puheaineiston siirtäminen tietosuoja-asetuksen V lukua noudattaen ei ole kohtuudella mahdollista.
4.4. Lisenssinsaajan on ilmoitettava Kielipankille ilman aiheetonta viivytystä, mikäli Puheaineistoon kohdistuu henkilötietojen tietoturvaloukkaus, jonka seurauksena on siirrettyjen, tallennettujen tai muuten käsiteltyjen henkilötietojen vahingossa tapahtuva tai lainvastainen tuhoaminen, häviäminen, muuttaminen, luvaton luovuttaminen taikka pääsy tietoihin.
Lisenssinsaajan on poistettava Puheaineisto tietoturvallisesti silloin, kun sillä ei enää ole Tietosuojalainsäädännön mukaista perustetta Puheaineiston käsittelyyn. Puheaineisto on joka tapauksessa poistettava tällä Sopimuksella myönnetyn käyttöoikeuden päättyessä. Lisenssinsaaja dokumentoi, miten Puheaineisto on poistettu. Kielipankilla on oikeus saada pyynnöstä itselleen tämä dokumentaatio sekä Lisenssinsaajan antama vakuutus siitä, että Puheaineisto on poistettu.
5.1. Kielipankki voi tuottaa Puheaineistosta uusia versioita esimerkiksi sen varmistamiseksi, että Tietosuojalainsäädännön mukaiset rekisteröidyn oikeudet toteutetaan ja Puheaineisto ei sisällä lainvastaista sisältöä. Kun Kielipankki tuottaa Puheaineistosta uuden version ja ilmoittaa siitä sähköpostitse Lisenssinsaajan yhteyshenkilölle, Lisenssinsaajan on viivytyksettä poistettava vanha versio Puheaineistosta ja korvattava se uudella. Lisenssinsaajan on kohdan 8 mukaisesti toimitettava Kielipankille toimiva ja ajantasainen sähköpostiosoitteensa, johon ilmoitetaan Puheaineiston päivityksistä.
Lisenssinsaajan on ilmoitettava viivytyksettä Kielipankille, jos se havaitsee tai epäilee, että Puheaineisto sisältää:
(a) luvattomia, virheellisiä, tarpeettomia tai vanhentuneita henkilötietoja (esimerkiksi suoria tunnistetietoja kuten nimiä ja yhteystietoja, henkilön yksityiselämää koskevia tietoja, juoruja tai jotakuta herjaavaa puhetta),
(b) luvattomia tekijänoikeuden tai sen lähioikeuksien suojaamien teosten tai muiden kohteiden kappaleita,
(c) liikesalaisuuksia,
(d) tietoja, joiden esittäminen ilmeisesti täyttäisi rikoslain yksityisyyden, rauhan ja kunnian loukkaamisen (24 luku), kiihottamisen kansanryhmää vastaan (11:10 – 10 a) tai muun rikoksen tunnusmerkistön, tai
(e) äänitteitä, joissa puhetta on nauhoitettu puhujan tietämättä tai nauhoitus on käynnistetty vahingossa.
Lisenssinsaajan tulee liittää ilmoitukseen tiedot, joiden avulla Kielipankki voi tunnistaa kyseisen äänitteen.
6.1. Kielipankki luovuttaa Puheaineiston kopion Lisenssinsaajalle ”sellaisena kuin se on”. Kielipankki ei anna mitään takuuta Puheaineistosta, sen tarkkuudesta, täydellisyydestä, sopivuudesta tiettyyn käyttötarkoitukseen, tai siitä, että Puheaineisto ei riko kolmansien oikeuksia. Lisenssinsaaja käyttää Puheaineistoa omalla vastuullaan. Kielipankki ei ole vastuussa Lisenssinsaajalle aiheutuvista vahingoista tai menetyksistä, jotka aiheutuvat Puheaineiston käyttämisestä.
7.1. Lisenssinsaaja on vastuussa siitä, että se käyttää Puheaineistoa Tietosuojalansäädäntöä ja muuta soveltuvaa lainsäädäntöä noudattaen.
Osapuolet ovat vastuussa toisiaan kohtaan sopimusrikkomuksella aiheuttamistaan vahingoista. Kielipankki ei vastaa epäsuorista tai välillisistä vahingoista. Kielipankin yhteenlaskettu korvausvastuu on kaikissa tapauksissa rajoitettu Lisenssinsaajan Kielipankille käyttöoikeudesta maksamaan summaan. Yllä mainitut vastuunrajoitukset eivät sovellu, jos vahinko on aiheutettu tahallaan tai törkeällä huolimattomuudella.
7.2. Osapuoli ei ole vastuussa toiselle Osapuolelle, jos tämän Sopimuksen mukaisen velvoitteen täyttämisen laiminlyönti johtuu ylivoimaisesta esteestä. Ylivoimaiseksi esteeksi katsotaan mukaan lukien, mutta niihin rajoittumatta – tulipalo, tulva, räjähdys, salama, myrskytuuli, maanjäristys, maan vajoaminen, energian saantiin kohdistuvat keskeytykset, valtion väliintulo, kapina, mellakka, sota, lakot, työselkkaus, liikennehäiriöt, työvoimapula tai muu seikka, johon Osapuoli ei ole kohtuudella voinut vaikuttaa.
8.1. Kaikki tähän Sopimukseen liittyvät ilmoitukset lähetetään postitse, lähettikuljetuksena tai sähköpostitse Sopimuksen allekirjoitusosassa mainitulle Osapuolen yhteyshenkilölle. Mikäli Osapuolen yhteystiedoissa tapahtuu muutoksia, se lähettää uudet yhteystiedot toiselle Osapuolelle ilman aiheetonta viivytystä.
9.1. Sopimus tulee voimaan viimeisen allekirjoituksen päivästä lukien ja on voimassa 10 vuotta voimaantulopäivästä. Lisenssinsaaja voi irtisanoa Sopimuksen ilmoittamalla irtisanomisesta kirjallisesti Kielipankille, jolloin Sopimus päättyy kolmenkymmenen (30) päivän kuluttua ilmoituksesta. Kielipankilla ei ole velvollisuutta palauttaa Puheaineiston käyttöoikeudesta maksettua korvausta eikä osaa siitä.
Kuten yllä kohdassa 4.8 on todettu, Puheaineisto on poistettava, kun henkilötietojen käsittelyyn ei enää ole Tietosuojalainsäädännön mukaista perustetta. Puheaineistoa koskevan käyttöoikeuden voimassaoloaikana Kielipankki luovuttaa Puheaineistosta uuden kopion Lisenssinsaajalle pyynnöstä kohtuullisessa ajassa, jos Lisenssinsaaja haluaa aloittaa uudelleen Puheaineiston käsittelyn.
9.2. Jos Osapuoli rikkoo olennaisesti tätä Sopimusta eikä korjaa rikkomustaan kolmenkymmenen (30) päivän kuluessa tätä koskevan kirjallisen ilmoituksen saatuaan, tai jos rikkomus ei luonteensa vuoksi ole korjattavissa, toisella Osapuolella on oikeus purkaa tämä Sopimus. Selvyyden vuoksi todetaan, että Puheaineiston käyttöä koskevan korvauksen laiminlyömistä ja olennaista Tietosuojalainsäädännön rikkomista pidetään olennaisena sopimusrikkomuksena.
Jos Osapuoli on ilmeisesti maksukyvytön, asetetaan, hakee tai haetaan konkurssiin, yrityksen saneerausmenettelyyn tai muuhun vastaavaan menettelyyn, toisella Osapuolella on oikeus purkaa Sopimus päättymään välittömästi.
9.3. Kohdan 4 mukaisesti Lisenssinsaajan käyttöoikeus Puheaineistoon päättyy välittömästi Sopimuksen voimassaolon päättyessä.
Sopimuksen kohdat 6, 7, 10 ja 11.5 sekä sellaiset kohdat, jotka on luonteensa vuoksi tarkoitettu pysymään voimassa, pysyvät voimassa myös Sopimuksen päättymisen jälkeen.
10.1. Sopimukseen sovelletaan Suomen lakia sen lainvalintasäännöksiä lukuun ottamatta.
Tähän Sopimukseen liittyvät erimielisyydet, joita ei saada Sopijapuolten välillä sovittua, ratkaistaan Helsingin käräjäoikeudessa.
10.2. Jos Lisenssinsaajan toimipaikka on valtiossa, jossa suomalaisen tuomioistuimen ratkaisu ei olisi täytäntöön pantavissa, tästä Sopimuksesta aiheutuvat riidat ratkaistaan lopullisesti välimiesmenettelyssä Suomen Keskuskauppakamarin välimiesmenettelysääntöjen mukaisesti. Välimiesoikeus on yksijäseninen. Välimiesmenettelyn paikka on Helsinki, Suomi. Välimiesmenettelyn kieli on suomi.
11.1. Kielipankilla on oikeus tehdä näihin yleisiin ehtoihin muutoksia perustelluista syistä, jotka voivat liittyä esimerkiksi viranomaisen antamiin ohjeisiin, hyviin käytäntöihin tai Tietosuojalainsäädännön tai muun soveltuvan lainsäädännön muutoksiin. Muutoksista ilmoitetaan sähköpostitse Lisenssinsaajan antamaan yhteysosoitteeseen 60 päivää ennen niiden voimaantuloa. Mikäli Lisenssinsaaja ei hyväksy yleisiin ehtoihin tehtyjä muutoksia, sillä on oikeus irtisanoa Sopimus päättymään ennen muutosten voimaantuloa ilmoittamalla Kielipankille kirjallisesti irtisanomista vähintään 30 päivää ennen muutosten voimaantuloa. Kielipankilla ei ole velvollisuutta palauttaa Puheaineiston käyttöoikeudesta maksettua korvausta eikä osaa siitä.
Lisenssinsaaja ei voi siirtää tätä Sopimusta tai sen osaa kolmannelle ilman Kielipankin nimenomaista kirjallista suostumusta.
11.2. Sopimus liitteineen syrjäyttää kaikki aiemmat Osapuolten väliset Sopimuksen aiheeseen liittyvät neuvottelut, sitoumukset ja muut tahdonilmaisut.
Mikäli jokin tämän Sopimuksen sopimusehto on pätemätön tai mitätön tai tulee sellaiseksi, Sopimus pysyy muilta osin voimassa. Jos jokin tämän Sopimuksen mitätön, täytäntöönpanokelvoton tai laiton lauseke muuttuu päteväksi, täytäntöönpanokelpoiseksi ja lailliseksi, kun osa siitä poistetaan, lauseketta sovelletaan pienimmin mahdollisin muutoksin, joiden ansiosta se on laillinen, pätevä ja täytäntöönpanokelpoinen.
11.3. Osapuoli ei saa käyttää toisen Osapuolen nimeä tai logoa tuotemarkkinoinnissa, lehdistötiedotteissa tai muussa vastaavassa tarkoituksessa, ellei käytöstä ole erikseen sovittu kirjallisesti. Lisenssinsaaja saa kuitenkin viitata asianmukaisesti Donera prat -kampanjaan ja Kielipankkiin Puheaineiston lähteenä. Selvyyden vuoksi todetaan, että Kielipankilla on oikeus mainita Lisenssinsaaja Puheaineiston vastaanottajana Lahjoita puhetta -tietosuojasivuilla sekä muissa yhteyksissä, joissa Puheaineiston vastaanottajien mainitseminen on tarpeellista Kielipankin velvoitteiden noudattamiseksi.
Tämän sivun pysyvä tunniste: urn:nbn:fi:lb-2024111133
Tämän lisenssisivun pysyvä tunniste: urn:nbn:fi:lb-2023041804
Tätä sivua on viimeksi päivitetty: 28.4.2025
Aineisto(t):
Oikeudenhaltija: M. A. Castrénin seura
Julkinen Lisenssi: Creative Commons Nimeä 4.0 Kansainvälinen (CC-BY)
Oikeudenhaltija myöntää Käyttäjälle oikeuden käyttää ja kopioida Aineistoa edellä mainitun Julkisen Lisenssin mukaisilla ehdoilla. Julkisen Lisenssin kopio on alempana tällä sivulla.
Hae tämä lisenssi raakatekstinä (englanniksi)
Alla oleva teksti on sanatarkka kopio sivusta Creative Commons Nimeä 4.0 Kansainvälinen Julkinen Lisenssi, haettu 2021-12-02.
Creative Commons Corporation (”Creative Commons”) ei ole asianajo- tai lakiasiaintoimisto, eikä se tarjoa oikeudellisia palveluja tai neuvoja. Creative Commonsin julkisten lisenssien levittäminen ei luo toimeksianto- eikä muutakaan suhdetta. Creative Commons tarjoaa lisenssinsä ja niihin liittyvät tiedot ”sellaisena kuin ne ovat”. Creative Commons ei anna mitään takuita liittyen lisensseihinsä tai niillä julkaistuihin aineistoihin taikka muihin liitännäisiin tietoihin eikä ota mitään vastuuta vahingoista, jotka aiheutuvat niiden käytöstä, siinä määrin kuin laki tällaisen määräyksen sallii.
Creative Commonsin julkiset lisenssit tarjoavat vakioidut ehdot, joita teosten luojat ja muut oikeudenhaltijat voivat käyttää jakaakseen luomistyönsä itsenäisiä ja omaperäisiä tuloksia sekä muita tekijänoikeuden ja tiettyjen muiden alla olevassa julkisessa lisenssissä määriteltyjen oikeuksien alaisia sisältöjä ja aineistoja. Seuraavat huomiot on tarkoitettu vain tiedoksi, eivätkä ne ole tyhjentäviä eivätkä muodosta osaa lisensseistämme.
Huomioita lisenssinantajille: Julkiset lisenssimme on tarkoitettu sellaisten tahojen käyttöön, joilla on oikeus antaa yleisölle lupa käyttää aineistoa tavoilla, joita muuten rajoittaisivat tekijänoikeus ja tietyt muut oikeudet. Lisenssejämme ei voi peruuttaa. Lisenssinantajien tulisi lukea ja ymmärtää valitsemansa lisenssin ehdot ennen lisenssin käyttämistä. Lisenssinantajien tulisi myös hankkia kaikki tarvittavat oikeudet ennen lisenssiemme käyttöä, jotta yleisö voi käyttää aineistoa uudelleen odotetulla tavalla. Lisenssinantajien tulisi selvästi merkitä kaikki aineisto, jota lisenssi ei koske. Tällaiseen aineistoon kuuluu muilla CC-lisensseillä lisensoitu aineisto sekä aineisto, jota on käytetty tekijänoikeutta koskevan poikkeuksen tai rajoituksen nojalla. Lisää huomioita lisenssinantajille.(Oikeudellinen teksti)
Huomioita yleisölle: Käyttäessään jotakin julkisista lisensseistämme lisenssinantaja antaa yleisölle luvan käyttää lisensoitua aineistoa määriteltyjen ehtojen mukaisesti. Jos lisenssinantajan lupa ei jostain syystä ole tarpeen – esimerkiksi siksi, että tekijänoikeuteen soveltuu jokin poikkeus tai rajoitus – lisenssi ei rajoita tällaista käyttöä. Lisensseillämme annetaan vain sellaiset tekijänoikeuden ja tiettyjen muiden oikeuksien alaiset luvat, jotka lisenssinantaja on oikeutettu antamaan. Lisensoidun aineiston käyttö voi edelleen olla rajoitettua muista syistä, esimerkiksi siksi, että jollakulla muulla on aineistoon tekijänoikeus tai muita oikeuksia. Lisenssinantaja voi esittää erityisiä pyyntöjä, esimerkiksi pyynnön merkitä tai kuvailla kaikki aineistoon tehdyt muutokset. Vaikka lisenssi ei sitä edellytä, kannustamme sinua kunnioittamaan näitä pyyntöjä silloin, kun se on kohtuullista. Lisää huomioita yleisölle.(Asiakirja)
Käyttämällä Lisensoituja Oikeuksia (määritelty alla) Sinä hyväksyt tämän Creative Commons Nimeä 4.0 Kansainvälisen Julkisen Lisenssin (”Julkinen Lisenssi”) ehdot ja sitoudut noudattamaan niitä. Siinä laajuudessa kuin tämä Julkinen Lisenssi voidaan tulkita sopimukseksi, Lisensoidut Oikeudet myönnetään Sinulle vastineena siitä, että Sinä hyväksyt nämä ehdot, ja Lisenssinantaja myöntää Sinulle kyseiset oikeudet vastineena niistä eduista, jotka Lisenssinantaja saa asettamalla Lisensoidun Aineiston saataville näillä ehdoilla.
Sinun Lisensoitujen Oikeuksien käyttöösi sovelletaan nimenomaisesti seuraavia ehtoja.
Sikäli kuin Lisensoidut Oikeudet sisältävät Sui Generis Tietokantaoikeuksia, jotka koskevat Sinun Lisensoidun Aineiston käyttöäsi:
Selvyyden vuoksi todettakoon, että tämä osa 4 täydentää eikä syrjäytä Sinun tästä Julkisesta Lisenssistä johtuvia velvollisuuksiasi tilanteissa, joissa Lisensoidut Oikeudet käsittävät muita Tekijänoikeuksia ja Samankaltaisia Oikeuksia.
Selvyyden vuoksi todettakoon, ettei tämä kohta 6(b) vaikuta mihinkään sellaisiin oikeussuojakeinoihin, jotka ovat Lisenssinantajan käytettävissä perustuen tämän Julkisen Lisenssin loukkaamiseen Sinun toimestasi.