Latest versions and variants: | |
The Suomi 24 Sentences Corpus 2001-2020, Korp version Metadata and license Citation instructions |
Open the resource in Korp (including the years 2001-2017 and the update 2018-2020) |
The Suomi 24 Corpus 2001-2020, VRT version Metadata and license Citation instructions |
Download the resource (including the years 2001-2017 and the update 2018-2020) |
The Suomi 24 Sentences Corpus 2018-2020, Korp-version Metadata and license Citation instructions |
Open the resource in Korp |
The Suomi24 Corpus 2018-2020, VRT version Metadata and license Citation instructions |
Download the resource |
The Suomi24 Sentences Corpus 2001-2017, Korp version 1.2 Metadata and license Citation instructions for this version |
Open the resource in Korp |
The Suomi24 Corpus 2001-2017, VRT version 1.1 Metadata and license Citation instructions for this version |
Download the resource |
Search for all available versions |
The resource consists of the discussions posted on the Suomi 24 discussion forum. The content has been annotated with automatic methods and stored in VRT format.
Via the Korp service, it is possible to perform versatile search queries from the content and to obtain various statistics and visualizations (see Korp instructions).
Without logging in via Korp, you can see the items matching your search criteria as brief excerpts only. At each word token in the concordance, you can find a link to the original message and discussion thread on the original Suomi 24 discussion platform, in case they are still available there. If required, researchers can also log in in case they need to view the wider context around the matching items.
In addition to the corpus versions that are available in Korp, the corresponding full text documents are available for logged-in researchers in VRT format either on the CSC computing environment or as downloadable packages via the download service of Kielipankki. In order to use the computing environment, researchers need a CSC user account. Please note, however, that in order to use the full text data efficiently, some technical and programming skills are usually required. The Korp service provides many opportunities for studying and analyzing the Suomi 24 corpus, so it is recommended that you first make sure whether Korp is suitable for your purpose.
Persistent identifier of this page: http://urn.fi/urn:nbn:fi:lb-2022011221
Viimeisimmät versiot: | |
Suomi24 virkkeet -korpus 2001-2020, Korp-versio Kuvailutiedot ja lisenssi Viittausohje |
Avaa aineisto Korp-palvelussa (sis. sekä vuodet 2001-2017 että päivityksen 2018-2020) |
Suomi24-korpus 2001-2020, VRT-versio Kuvailutiedot ja lisenssi Viittausohje |
Lataa aineisto (sis. sekä vuodet 2001-2017 että päivityksen 2018-2020) |
Suomi24 virkkeet -korpus 2018-2020, Korp-versio Kuvailutiedot ja lisenssi Viittausohje |
Avaa aineisto Korp-palvelussa |
Suomi24-korpus 2018-2020, VRT-versio Kuvailutiedot ja lisenssi Viittausohje |
Lataa aineisto |
Suomi24 virkkeet -korpus 2001-2017, Korp-versio 1.2 Kuvailutiedot ja lisenssi Viittausohje tähän versioon |
Avaa aineisto Korp-palvelussa |
Suomi24-korpus 2001-2017, VRT-versio 1.1 Kuvailutiedot ja lisenssi Viittausohje tähän versioon |
Lataa aineisto |
Etsi muut saatavilla olevat versiot |
Aineisto koostuu Suomi 24 -foorumilta kerätyistä keskusteluista. Sisältö on jäsennetty automaattisin menetelmin ja tallennettu VRT-muotoon.
Korpin kautta tarjottavasta Suomi 24 -korpuksesta voi tehdä monipuolisia hakuja ja tilastoida tai kuvantaa hakutuloksia eri tavoin (katso Korp-palvelun ohjeet).
Kirjautumattomille käyttäjille aineiston tekstisisällöstä löytyneet hakuosumat näytetään Korpissa lyhyinä otteina. Hakuosumien kohdalta on linkit alkuperäiseen viestiin ja keskusteluketjuun Suomi 24 -palvelimella, mikäli nämä ovat edelleen olemassa. Tarvittaessa tutkija saa näkyviin myös laajemman kontekstin kirjautumalla Korp-palveluun.
Korp-palvelussa näkyvän korpusversion lisäksi vastaava VRT-muotoinen kokotekstiaineisto on kirjautuneiden tutkijoiden käytettävissä CSC:n laskentaympäristössä tai ladattavissa omalle koneelle Kielipankin latauspalvelusta. Laskentaympäristön käyttäminen edellyttää CSC:n myöntämää käyttäjätunnusta. Huomaa, että kokotekstiaineiston hallintaan ja tehokkaaseen käsittelyyn tarvitaan yleensä jonkin verran teknistä osaamista ja ohjelmointitaitoja. Korp-palvelu tarjoaa monia mahdollisuuksia myös Suomi 24 -aineiston tutkimiseen, joten kannattaa ensin varmistaa, sopiiko se omaan tarkoitukseesi.
Tämän sivun PID: http://urn.fi/urn:nbn:fi:lb-2017021630