Kielipankin luvanvaraisten aineistojen (CLARIN RES) käyttöehtojen päivitys

In English

Helmikuussa 2022 tehdyn Kielipankin yleisten ehtojen ja aineistokohtaisten käyttöehtojen päivityksen jälkeen kävi ilmi, että luvanvaraisia aineistoja koskeviin CLARIN RES -tyyppisiin lisensseihin kaivattiin vielä tarkennusta. 24.5.2022 alkaen RES-lisenssien uusi versio 2.1 alkaa seuraavalla tavalla (muuttuneet kohdat lihavoitu):

”Oikeudenhaltija myöntää Käyttäjälle henkilökohtaisen maksuttoman, ei-yksinomaisen ja pysyvän (tekijänoikeuden voimassaoloajan kestävän) oikeuden käyttää ja kopioida Aineistoa Käyttäjän kanssa sovittuun tarkoitukseen muutettuna, muuttamattomana tai osana yhteenliitettyä teosta. […]”

Luvanvaraisten aineistojen uudet käyttäjät hyväksyvät loppukäyttäjän lisenssin uusimman version ennen hakemuksen tekemistä Kielipankin oikeudet -palvelussa. Lisenssien muutoksista ilmoitetaan vielä erikseen sähköpostitse niille käyttäjille, joilla on ennestään Kielipankin oikeudet -palvelun kautta myönnetty pääsy yhteen tai useampaan rajoitettuun aineistoon.

Linkki yksittäisen aineiston lisenssiin löytyy Kielipankin aineistoluettelosta tai kyseisen aineistoversion kuvailutietueesta (ks. Documentation).

Kooste Kielipankin soveltamien loppukäyttäjän lisenssien sisällöstä, erilaisten lisäehtojen mahdollisista yhdistelmistä ja näissä äskettäin tapahtuneista muutoksista löytyy sivulta CLARIN-aineistojen loppukäyttäjän lisenssit.

The licenses regarding restricted corpora (CLARIN RES) were updated

Suomeksi

After the general update of the Terms of Use of the Language Bank of Finland and the resource-specific end-user licenses that took place in February 2022, it turned out that a further clarification was required for CLARIN RES type licenses. Starting on 24th May 2022, the new version 2.1 of the RES license begins in the following way (here, the changes are bolded):

”The Rightholder grants the End-User a personal free, non-exclusive and perpetual (for the duration of the copyright) right to use and make copies of the Resource for the purpose agreed with the End-User as such, as modified, or as part of a compilation or derived work. […]”

New users of restricted resources must accept the end-user licenses before applying for access via Language Bank Rights. Those users who already have access to one or more restricted resources will be notified about license changes to the email address that was provided along with their application.

The link to the license of an individual resource can be found on the list of corpora in the Language Bank of Finland or via the metadata record (see Documentation) of the resource version in question.

Please see CLARIN End-User License Agreements (EULA) for an overview of the changes that have recently taken place in the end-user licenses applied by the Language Bank.

Updates to the Terms of Use of the Language Bank of Finland

The Terms of Use of the Language Bank of Finland and the resource-specific license terms and conditions have been updated.

The Terms of Use of the Language Bank of Finland and the General Terms of Use for CSC’s Services for Research and Education are binding to all users of the Language Bank of Finland. In addition, the users are required to comply with the resource-specific terms and conditions.

Read the general terms as well as the resource-specific licenses carefully. The link to the license of a given resource is provided in the metadata record of the resource in question and on the list of resources of the Language Bank.

During the spring, the licenses of all resources that contain personal data will be supplemented with resource-specific data protection terms and conditions. In case you notice that the data protection terms and conditions have not yet been specified for the resource you are planning to use, please follow the guidelines for processing corpora stored in the Language Bank of Finland that contain personal data and contact the Language Bank in case you need further information regarding data protection.

Notifications about updates regarding the licenses of individual resources will be published on the Language Bank website as well as emailed to the users who have access to the resource on the basis of a separate application.

 

Päivityksiä Kielipankin yleisiin käyttöehtoihin

Kielipankin yleiset käyttöehdot on päivitetty. Samalla on täsmennetty myös aineistokohtaisia käyttöehtoja.

Kielipankin yleiset käyttöehdot sekä CSC:n tutkimuksen ja opetuksen palvelujen yleiset käyttöehdot sitovat kaikkia Kielipankin käyttäjiä. Lisäksi käyttäjien on noudatettava aineistokohtaisia ehtoja.

Tutustu yleisiin käyttöehtoihin ja jokaisen käyttämäsi aineiston käyttöehtoihin huolellisesti. Linkki yksittäisen aineiston lisenssiin löytyy kyseisen aineiston kuvailutietueesta ja Kielipankin verkkosivuilla olevasta aineistoluettelosta.

Henkilötietoja sisältävien aineistojen (PRIV-merkintä) lisensseihin lisätään kevään aikana aineistokohtaiset tietosuojaehdot. Jos tietosuojaehtoja ei jonkin käyttämäsi aineiston osalta vielä ole, noudata ohjeita henkilötietoja sisältävien Kielipankin aineistojen käsittelyyn ja pyydä tarvittaessa lisätietoja Kielipankista.

Aineistokohtaisten käyttöehtojen päivityksistä ilmoitamme jatkossa Kielipankin verkkosivuilla sekä sähköpostitse niille käyttäjille, jotka ovat saaneet erillisellä hakemuksella pääsyn aineistoon.

Kielipankin aineistokohtaiset käyttöehdot ja tietosuojaehdot uudistuvat

Kielipankin aineistokohtaisiin käyttöehtoihin on alkuvuoden 2022 aikana tulossa joitakin tarkennuksia ja täydennyksiä. Näkyvimpänä muutoksena ovat aineistokohtaiset tietosuojaehdot, jotka lisätään kaikkien henkilötietoja sisältävien aineistojen käyttöehtoihin uutena osiona. Ilmoitamme yksittäisten aineistojen käyttöehtoihin liittyvistä päivityksistä Kielipankin verkkosivuilla.

Kielipankissa oleva aineisto sisältää henkilötietoja, jos sen lisenssissä on merkintä +PRIV. Tällöin sitoudut käsittelemään aineiston sisältämiä henkilötietoja luottamuksellisesti, huolellisesti ja vain siihen käyttötarkoitukseen, jota varten olet saanut aineistoon pääsyn. Muut henkilötietojen käsittelyä koskevat rajoitukset kerrotaan aineistokohtaisissa tietosuojaehdoissa. Katso myös Kielipankin yleiset ohjeet henkilötietoja sisältävien aineistojen käsittelyyn.

Kun ryhdyt käyttämään Kielipankissa olevaa henkilötietoja sisältävää aineistoa uudessa hankkeessa tai uuteen tarkoitukseen, ilmoita hankkeesi lyhyt ja yleistajuinen otsikko sekä avoimesti saatavilla olevan tietosuojaselosteen linkki Kielipankille tällä lomakkeella. Julkaisemme antamasi tiedot Kielipankin verkkosivuilla, jolloin ne ovat kaikkien aineiston käytöstä kiinnostuneiden nähtävillä.

Muistathan tutustua jokaisen käyttämäsi aineiston käyttöehtoihin huolellisesti. Jos jokin käyttöehdoissa askarruttaa tai et löydä tässä vaiheessa kaikkia tarvitsemiasi tietoja, kysythän Kielipankista lisää.

New ”resource group” pages on the Language Bank website

In the Language Bank of Finland, a given resource may be available as several different versions or variants that are provided for different purposes. For instance, the resource may be offered as a downloadable version, but there may also be a variant that is searchable via Korp.

In order to make it more convenient for users to locate the corpus version they need, we started creating resource group pages that provide an overview of all the available versions of the resource in question. For instance, all the resource versions that are included in the Plenary Sessions of the Parliament of Finland (eduskunta) resource group can be found at https://www.kielipankki.fi/corpora/eduskunta/.

All the resources that are available via the Language Bank of Finland are listed on the Corpora page, https://www.kielipankki.fi/corpora/. For each individual resource version mentioned on the list, you can find links to the

  • the metadata record
  • the license terms and conditions (for corpora including personal data, these will also contain the resource-specific data processing terms and conditions)
  • the access location of the resource (e.g., Korp, download service, or Puhti computing environment)
  • the resource group page (or a similar documentation page)
  • the citation instructions, including the persistent identifier of the resource version in question.

When citing the resource, please refer to the specific resource version that was used. This will make your research easier to replicate.

Uudet aineistoryhmien tietosivut Kielipankin verkkosivuilla

Samasta aineistosta voi olla yhtä aikaa saatavilla useita erilaisia versioita, joista käyttäjä voi valita omiin tarkoituksiinsa sopivimman. Tietty aineisto voi esimerkiksi olla tarjolla sekä omalle koneelle ladattavana versiona että Korp-palvelun kautta tutkittavana versiona.

Jotta sopivan aineistoversion löytäminen kävisi helpommin, tietystä aineistosta tehdyt versiot ja muunnelmat on ryhdytty keräämään yhteen uusille aineistoryhmien tietosivuille. Esimerkiksi viimeisimmät Eduskunnan täysistunnot (eduskunta) -ryhmään kuuluvat aineistoversiot voi tarkistaa osoitteesta https://www.kielipankki.fi/aineistot/eduskunta/.

Kaikki Kielipankin kautta välitettävät aineistot on tuttuun tapaan lueteltu Kielipankin aineistosivulla, https://www.kielipankki.fi/aineistot/. Aineistosivulla olevassa taulukossa on linkit kunkin aineistoversion

  • kuvailutietueeseen
  • lisenssiin
  • sijainti- eli käyttöpaikkaan (esim. Korpissa, latauspalvelussa tai Puhti-ympäristössä)
  • vastaavan aineistoryhmän sivuun sekä
  • kyseisen aineistoversion viittausohjeeseen, jossa on mukana aineiston pysyvä tunniste.

Kun viittaat aineistoon, mainitsethan sen aineistoversion viitetiedot, jota olet käyttänyt. Näin tutkimuksesi on helpommin toistettavissa.

Suomelle teknologinen etulyöntiasema puhepankin avulla? Useat suomalaisyritykset ovat jo mukana ainutlaatuisessa puheenkeruussa

Ylen artikkelissa kerrotaan Lahjoita puhetta -kampanjan merkityksestä Suomelle ja suomen kielelle. Myös Kielipankki on mainittu!

Lue koko juttu

Helsingin yliopiston uutiset: Le­ku­ri on ski­dien gaif­fa­ri – lah­joi­ta si­nä­kin pu­het­ta ja teko­äly ym­mär­tää pian myös mur­tei­ta

Helsingin yliopiston uutispalstalla kerrotaan Lahjoita puhetta -kampanjasta, jossa myös Kielipankki on mukana. Mari Peltosen haastateltavina olivat Krister Lindén ja Mietta Lennes.

Lue juttu

 

How to cite a corpus that is available in the Language Bank of Finland

Did you know that the Language Bank of Finland offers reference instructions, including a persistent identifier, for each and every corpus version? You should include the reference in all publications where the corpus in question has been used.

Systematic citation practices make your study easier to replicate, and the corpus compilers can be recognized for their work.

Read more

 

How to locate reference instructions on the list of corpora

Näin viittaat Kielipankissa olevaan aineistoon

Tiesitkö, että Kielipankki tarjoaa jokaiselle aineistolle ja sen eri versioille valmiin viittausohjeen, joihin sisältyy aineiston pysyvä tunniste? Tiedot kannattaa lisätä lähdeluetteloon kaikissa julkaisuissa, joissa kyseistä aineistoa on hyödynnetty.

Yhtenäinen viittaustapa helpottaa tutkimuksen toistamista. Samalla aineistojen koostajat saavat tunnustuksen työstään.

Lue lisää

 

Viittausmuodon löytäminen aineistolistalta

Search Google Scholar for publications related to individual corpora

The Language Bank of Finland provides citation instructions for all corpus versions. The reference instructions are accessible from the Corpora list of the Language Bank of Finland (click on the double quotes ) and from the metadata of each corpus. On the reference instruction page, you can now also find a link to a Google Scholar query for publications related to the corpus in question.

The links to Google Scholar are generated automatically by the Language Bank of Finland. In the links, the persistent identifier (PID) and the title of the corpus are used as optional search criteria.

Persistent identifiers have been used by the Language Bank since the year 2014. A unique persistent identifier is included in the reference instructions for each corpus distributed via the Language Bank of Finland. The identifiers will allow for specific corpus versions (or at least information about their status) to be retrieved even if their access locations, tools and methods change in the future.

References to research data sets are equally relevant as references to other scientific sources. Accurate references will help other researchers replicate your study. In addition, both your publications and the data sets you used will gain more visibility.

Check out the citation instructions of your favourite corpus in the Language Bank of Finland and try searching for publications about it!

Etsi Kielipankin aineistoihin liittyviä julkaisuja helposti Google Scholar -palvelusta

Kielipankin kautta välitettävien aineistojen jokaisella eri versiolla on oma viittausohje. Aineistokohtaiset ohjeet löytyvät Kielipankin aineistoluettelosta lainausmerkkikuvakkeiden kohdalta sekä jokaisen aineistoversion kuvailutiedoista. Viittausmuodon yhteydessä tarjotaan nyt myös Google Scholar -hakulinkki, joilla voi etsiä kyseiseen aineistoon liittyviä julkaisuja.

Scholar-hakulinkit tuotetaan Kielipankissa automaattisesti. Linkissä käytetään vaihtoehtoisina hakukriteereinä aineiston pysyvää tunnistetta (persistent identifier, PID) sekä kuvailutietojen mukaista otsikkoa.

Kielipankki on käyttänyt pysyviä tunnisteita vuodesta 2014 alkaen. Pysyvä tunniste sisältyy jokaisen Kielipankin aineiston viittausohjeeseen. Tunnisteen avulla tietyn aineistoversion tiedot löytyvät myös jatkossa, vaikka aineiston sijainti ja välitystapa muuttuisivat.

Viittaaminen tutkimusaineistoihin on yhtä tärkeää kuin viittaaminen muihin tieteellisiin lähteisiin. Täsmällisten aineistoviitteiden avulla tutkimuksesi on varmemmin toistettavissa. Sekä tuottamasi julkaisut että niissä käyttämäsi aineistot saavat lisää näkyvyyttä.

Tarkista suosikkiaineistosi viittausohje Kielipankin aineistolistalta ja katso, mitä julkaisuja siitä jo löytyy!

Kuinka Kielipankin aineistoihin viitataan?

Tutkimusaineistoihin viittaaminen on yhtä tärkeää kuin tieteellisiin julkaisuihin viittaaminen. Joko sinä osaat? Katso uudet ohjeet: https://www.kielipankki.fi/tuki/viittaa-kielipankkiin-ja-fin-clariniin/

Viittaa Kielipankin kielivaroihin 

Kielivaroihin on tärkeää viitata yhtenäisellä tavalla, jotta tutkimus olisi myöhemmin toistettavissa ja jotta aineistojen koostajat tai työkalujen kehittäjät saisivat tunnustuksen työstään.

Kun käytät Kielipankissa olevaa kielivaraa (aineistoa tai työkalua), noudata Kielipankin viittausohjeita. Näin käyttämäsi kielivaran tarkka versio tulee täsmällisesti mainituksi. Kielipankissa jokaisella kielivaraversiolla on yksilöllinen pysyvä tunniste, joka sisältyy aina viittausohjeeseen. Tunniste auttaa varmistamaan, että kielivara löytyy ja tutkimuksen toistaminen onnistuu myös tulevaisuudessa, vaikka aineiston tai työkalun sijainti muuttuisi. 

Monien aineistojen tai työkalujen lisenssiehdoissa edellytetään käyttäjiltä viittaamista kyseiseen kielivaraan. Tällöin lisenssissä mainitaan lisäehto BY (Nimeä/Attribution). Asianmukainen viittaus vaaditaan kaikkien sellaisten kielivarojen osalta, jotka on lisensoitu joko akateemiseen käyttöön (CLARIN ACA) tai luvanvaraiseen käyttöön (CLARIN RES). Myös avoimesti lisensoidut kielivarat saattavat edellyttää viittaamista (esim. Creative Commons Nimeä tai muut avoimet lisenssit).

Viittaamalla Kielipankkiin ja sen tarjoamiin kielivaroihin autat FIN-CLARINia seuraamaan aineistojen ja palveluiden käyttöastetta ja tuet Kielipankin jatkuvuutta.

Viittaaminen Kielipankissa olevaan aineistoon

Yksittäisten aineistoversioiden viittausohjeet löytyvät helposti Kielipankin aineistotaulukosta lainausmerkkikuvakkeen icon-quote-right kohdalta.

Viittausohje mainitaan myös kielivaran kuvailutiedoissa. Kaikkien Kielipankin kielivarojen kuvailutietueet tallennetaan META-SHARE-hakemistopalveluun. Tietyn kielivaran kuvailutietueeseen pääsee aina viittausohjeessa mainitulla pysyväistunnisteella tai Kielipankin aineistotaulukosta aineiston nimen kohdalta. Kuvailutietueessa linkki viittausohjeeseen löytyy yleensä osiosta Documentation. Joissakin tapauksissa viittausohje näkyy suoraan kuvailutietueen kentästä Attribution Details. Kuvailutiedoista löytyvät myös aineistokohtaisen lisenssin tiedot.

Korp-konkordanssipalvelun kautta tarjottavissa kieliaineistojen versioissa linkki viittausohjeeseen löytyy sekä korpusvalikossa näkyvästä aineiston tietoruudusta että konkordanssivälilehden oikeasta reunasta yksittäisten hakuosumien kohdalta. Tietoruudun saa näkyviin ohjaamalla osoittimen  korpusvalikossa aineiston nimen kohdalle.

Jokaiseen Kielivaran latauspalvelun kautta tarjottavaan aineistoversioon sisältyy aina README-niminen tiedosto, jossa mainitaan ko. aineistoversion pysyvä tunniste.

Viittausmuoto

Esimerkkinä kielivaran 1990- ja 2000-luvun suomalaisia aikakaus- ja sanomalehtiä -korpus, versio 2 viittausohje:

Helsingin yliopisto (2017). 1990- ja 2000-luvun suomalaisia aikakaus- ja sanomalehtiä -korpus, versio 2 [tekstikorpus]. Kielipankki. Saatavilla http://urn.fi/urn:nbn:fi:lb-2017091901

Aineistoviittauksia ja niiden muotoilua koskevat käytännöt saattavat vaihdella julkaisukohtaisesti. On hyvä joka tapauksessa pyrkiä mainitsemaan Kielipankin viittausohjeessa olevat tiedot. Kun kirjoitat artikkelia tai muuta tutkimusjulkaisua, tarkista julkaisun ohjeistuksesta, onko aineistolähteet tapana mainita kirjallisuusluettelon osana vai erillisessä listassa.

Viittaaminen Kielipankkiin, FIN-CLARINiin tai CLARINiin

Kielipankin osoite

Jos haluat mainita Kielipankin palvelukokonaisuutena, käytä verkko-osoitetta www.kielipankki.fi.

Viittaa FIN-CLARIN-konsortioon

FIN-CLARIN-konsortion esittely Kielipankin sivustolla: http://urn.fi/urn:nbn:fi:lb-2014120212

Viittaa CLARIN ERICiin

CLARIN ERICin ja CLARIN-palveluiden yleiset viittausohjeet löytyvät CLARINin usein esitettyjen kysymysten sivulta.

Lisätietoa tutkimusaineistoihin viittaamisesta

Ensimmäinen Korp-palvelun esittelyvideo

on nyt nähtävillä YouTubessa. Videossa esitellään Korpin perusnäkymä, yksinkertainen haku, tilastonäkymä ja sanakuva. Tutustu ja kokeile!

Videoon lisätään piakkoin suomen- ja englanninkielinen tekstitys ja lisää Korp-ohjevideoita on tulossa.

Mylly-palvelun esittely

on nyt nähtävillä YouTubessa. Videossa neuvotaan mm. kuinka voit jäsentää suomenkielisen tekstin automaattisesti tai tunnistaa puhetta suomenkielisestä äänitiedostosta.

Tutustu ja kokeile!


Videoon on saatavilla suomenkielinen tekstitys.

Kielipankki esillä Tietoarkisto-lehdessä 1/2018

Yhteiskuntatieteellisen tietoarkiston (FSD) julkaiseman Tietoarkisto-lehden tuoreimman numeron 1/2018 teemana ovat tutkimuksen infrastruktuurit. Mukana on myös Kielipankki-aiheinen artikkeli (s. 22-23). Lehden verkkoversiota pääsee lukemaan Yhteiskuntatieteellisen tietoarkiston sivuilta.

Kielipankki in a nutshell

Mietta Lennes (FIN-CLARIN) presents Kielipankki: https://www.youtube.com/watch?v=H_KBOKqUX3o

Kielipankin esittely

Mietta Lennes (FIN-CLARIN) esittelee Kielipankkia: https://www.youtube.com/watch?v=H_KBOKqUX3o

Hae Kielipankki-portaalista:
Harri Uusitalo
Kuukauden tutkija: Harri Uusitalo

 

Tulevat tapahtumat


Yhteystiedot

Kielipankin tekninen ylläpito:
kielipankki (ät) csc.fi
p. 09 4572001

Aineistoihin ja muuhun sisältöön liittyvät asiat:
fin-clarin (ät) helsinki.fi
p. 029 4129317

Tarkemmat yhteystiedot