The Karelian Finnish Newspaper Corpus

The corpus contains issues of the ’Karjalan Sanomat’ newspaper published in 2012-2014.

Latest versions/subcorpora:
The Karelian Finnish Newspaper Corpus
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Select the corpus in Korp
Search for all versions in META-SHARE

Of this language corpus different versions/subcorpora are (or might be in the future) published in the Language Bank of Finland. The versions are available through the Language Bank Download Service and/or through the Korp concordance tool. The links to the different versions can be found from the list above.

Detailed information on the content of each version, user rights and licenses can be found from it’s specific metadata record in META-SHARE.

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2021052401

The HS.fi News and Comments Corpus

The HS.fi News and Comments Corpus contains the domestic news of the Helsingin Sanomat website and their comments from 5.9.2011 to 4.9.2012. The corpus starts with the first news of 5.9.2011 and ends with a news published in the morning on 3.9.2012 and the comments published on the website by 5.9.2012.

Latest versions/subcorpora:
The HS.fi News and Comments Corpus
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Select the corpus in Korp
Search for all versions in META-SHARE

Of this language corpus different versions/subcorpora are (or might be in the future) published in the Language Bank of Finland. The versions are available through the Language Bank Download Service and/or through the Korp concordance tool. The links to the different versions can be found from the list above.

Detailed information on the content of each version, user rights and licenses can be found from it’s specific metadata record in META-SHARE.

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2021051910

The Newspaper and Periodical Corpus of the National Library of Finland, Kielipankki Version

This corpus contains newspapers and magazines from Finland starting from 1770, compiled by the National Library of Finland.

A list of the newspapers and magazines published in Finnish: https://www.kielipankki.fi/wp-content/uploads/klk-lehdet-fi.pdf

A list of the newspapers and magazines published in Swedish: https://www.kielipankki.fi/wp-content/uploads/klk-lehdet-sv.pdf.

Latest versions/subcorpora:
The Finnish Sub-corpus of the Newspaper and Periodical Corpus of the National Library of Finland, Kielipankki Version
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Select the corpus in Korp
The Swedish Sub-corpus of the Newspaper and Periodical Corpus of the National Library of Finland, Kielipankki Version
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Select the corpus in Korp
The Newspaper and Periodical Corpus of the National Library of Finland, Swedish sub-corpus, 1771–1879, VRT
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Available upon request
The Newspaper and Periodical Corpus of the National Library of Finland, Swedish sub-corpus, 1880–1948, scrambled, VRT
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Available upon request
Search for these versions in META-SHARE

Of this language corpus different versions/subcorpora are published in the Language Bank of Finland. The versions are available through the Language Bank Download Service and/or through the Korp concordance tool. The links to the different versions can be found from the list above.

Detailed information on the content of each version, user rights and licenses can be found from it’s specific metadata record in META-SHARE.

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-201405276

The Newspaper and Periodical OCR Corpus of the National Library of Finland

This corpus consists of the OCR results of the material in the corpus of publications digitized by the National Library of Finland.

The material published before 1875 is so old that any copyrights in it must have expired before 2015. For the material published from 1875 to 1920, note that parts of the resource are copyright-protected.

Latest versions/subcorpora:
The Newspaper and Periodical OCR Corpus of the National Library of Finland (1771-1874)
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Download the resource
The Newspaper and Periodical OCR Corpus of the National Library of Finland (1875-1920)
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Download the resource
Search for these versions in META-SHARE

Of this language corpus different versions/subcorpora are published in the Language Bank of Finland. The versions are available through the Language Bank Download Service and/or through the Korp concordance tool. The links to the different versions can be found from the list above.

Detailed information on the content of each version, user rights and licenses can be found from it’s specific metadata record in META-SHARE.

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-202104142

Corpus of Finnish Magazines and Newspapers from the 1990s and 2000s

This resource contains entire newspaper and magazine articles published in Finnish in the 1990s and 2000s. The goal was to create a contemporary dataset of magazines and newspapers of various origins, such as scientific journals, regional newspapers, company internal circulations, and trade union member journals. A detailed list of all magazines and newspapers contained in this resource can be found here.

Latest versions/subcorpora:
Corpus of Finnish Magazines and Newspapers from the 1990s and 2000s, Version 2
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Select the corpus in Korp
Corpus of Finnish Magazines and Newspapers from the 1990s and 2000s, Downloadable Version 2
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Download the resource
Corpus of Finnish Magazines and Newspapers from the 1990s and 2000s (VRT), Version 2
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Download the resource
Search for these versions in META-SHARE

Of this language corpus different versions/subcorpora are published in the Language Bank of Finland. The versions are available through the Language Bank Download Service and/or through the Korp concordance tool. The links to the different versions can be found from the list above.

Detailed information on the content of each version, user rights and licenses can be found from it’s specific metadata record in META-SHARE.

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2021032304

Finnish Text Collection

The Finnish Language Text Collection (Suomen kielen tekstikokoelma) is a selection of electronic Finnish texts from the 1990s. The collection contains texts from newspapers, journals as well as books. See the content details in Finnish.

All of the material is available for academic research use. A large part of the texts is also available for commercial use.

The collection was compiled by the Institute for the Languages of Finland, the Department of General Linguistics of the University of Helsinki and the Foreign Languages Department of the University of Joensuu.

Latest versions/subcorpora:
The Downloadable Version of the Finnish Text Collection
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Download the resource
The Downloadable Version of the Finnish Text Collection – Commercial Use
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Download the resource
The Helsinki Korp Version of the Finnish Text Collection
icon-info-circle Metadata and license
icon-quote-right Attribution instructions
Select the corpus in Korp
Search for these versions in META-SHARE

Of this language corpus different versions/subcorpora are published in the Language Bank of Finland. The versions are available through the Language Bank Download Service and/or through the Korp concordance tool. The links to the different versions can be found from the list above.

Detailed information on the content of each version, user rights and licenses can be found from it’s specific metadata record in META-SHARE.

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-201403268

STT:n uutisarkisto

Suomen Tietotoimiston (STT) uutisarkisto sisältää uutisjakelun suomenkieliset artikkelit, jotka STT on lähettänyt media-asiakkaidensa käytettäväksi vuosina 1992-2018.
Arkistossa on yhteensä noin 2,8 miljoonaa yksittäistä kohdetta. Valtaosa artikkeleista on uutisjuttuja, joiden pituus vaihtelee hyvin lyhyistä ”viivauutisista” uutissähkeisiin ja pidempiin uutisjuttuihin. Artikkelit on luokiteltu osastoittain (kotimaa, ulkomaat, talous, politiikka, kulttuuri, viihde ja urheilu) sekä sisältää metadataa (IPTC-asiasanat tai avainsanat sekä tietyiltä osin paikkaluokitukset). Arkisto sisältää myös muuta STT luomaa tai välittämää materiaalia kuten asiakkaille lähetettäviä uutislupauksia, urheilutuloksia, vieraskynäartikkeleita ja tiedotteita.

Viimeisimmät versiot:
STT:n uutisarkisto 1992-2018, lähdemateriaali
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Lataa aineisto
STT:n uutisarkisto 1992-2018, CoNLL-U, lähdemateriaali
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Lataa aineisto
lisenssi kaikille STT:n uutisarkiston kokoteksti-aineistoille
Etsi versiot META-SHARE haun kautta

Aineistoista työstetään Kielipankissa erilaisia versioita, jotka ovat saatavilla Kielipankin latauspalvelussa ja/tai Korp-konkordanssipalvelussa. Linkit aineistoihin löytyvät versiolistauksesta yllä.

Tarkempaa tietoa eri aineistoversioiden sisällöstä löytyy niiden kuvailutiedoista. Kuvailutiedoista löytyvät myös tiedot aineiston käyttöoikeuksista ja lisensseistä.

Tämän aineistoryhmäsivun PID: http://urn.fi/urn:nbn:fi:lb-2018121001

Ylen uutisaineistot

Ylen suomenkielinen uutisarkisto sisältää uutisartikkelit vuodesta 2011 ja ruotsinkielinen uutisarkisto vuodesta 2012 alkaen. Aineistot ovat karttuvia ja tiedot niiden uusimmista versioista julkaistaan tällä aineistosivulla.

Viimeisimmät versiot:
Ylen ruotsinkielinen uutisarkisto 2019-2020, lähdeaineisto
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Lataa aineisto
Ylen suomenkielinen uutisarkisto 2019-2020, lähdeaineisto
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Lataa aineisto
Etsi versiot META-SHARE haun kautta
Versiot 2011-2018:  
Ylen suomenkielinen uutisarkisto 2011-2018, Korp
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Aineisto Korpissa
Ylen suomenkielinen uutisarkisto 2011-2018, sekoitettu, Korp
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Aineisto Korpissa
Ylen suomenkielinen uutisarkisto 2011-2018, lähdeaineisto
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Lataa aineisto
Ylen suomenkielinen uutisarkisto 2011-2018, VRT
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Lataa aineisto
Ylen suomenkielinen uutisarkisto 2011-2018, sekoitettu VRT
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Lataa aineisto
Ylen suomenkielisen uutisarkiston selkouutiset 2011-2018, Korp
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Aineisto Korpissa
Ylen suomenkielisen uutisarkiston selkouutiset 2011-2018, sekoitettu, Korp
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Aineisto Korpissa
Ylen suomenkielisen uutisarkiston selkouutiset 2011-2018, lähdemateriaali
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Lataa aineisto
Ylen suomenkielisen uutisarkiston selkouutiset 2011-2018, VRT
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Lataa aineisto
Ylen suomenkielisen uutisarkiston selkouutiset 2011-2018, sekoitettu, VRT
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Lataa aineisto
Yle svenska webbartiklar 2012-2018, Korp
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Aineisto Korpissa
Yle svenska webbartiklar 2012-2018, blandad, Korp
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Aineisto Korpissa
Yle svenska webbartiklar 2012-2018, källmaterial
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Lataa aineisto
Yle svenska webbartiklar 2012-2018, VRT
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Lataa aineisto
Yle svenska webbartiklar 2012-2018, blandad, VRT
icon-info-circle Kuvailutiedot ja lisenssi
icon-quote-right Tämän version viittausohje
Lataa aineisto
Etsi versiot META-SHARE haun kautta  

Aineistoista työstetään Kielipankissa erilaisia versioita, jotka ovat saatavilla Kielipankin latauspalvelussa  ja/tai Korp-konkordanssipalvelussa. Linkit aineistoihin löytyvät versiolistauksesta yllä.

Tarkempaa tietoa eri aineistoversioiden sisällöstä löytyy niiden kuvailutiedoista. Kuvailutiedoista löytyvät myös tiedot aineiston käyttöoikeuksista ja lisensseistä.

Tämän aineistoryhmäsivun PID: http://urn.fi/urn:nbn:fi:lb-2021020901