 SNC1 Kansalliskirjaston sanoma- ja aikakauslehtikokoelman
 ruotsinkieliset n-grammit 1770-1940

SNC1 sisältää Kansalliskirjaston sanoma- ja aikakauslehtikokoelman
(KLK) ruotsinkielisestä osuudesta lasketut sanetason uni-, bi- ja
trigrammit frekvensseineen. Nämä ovat ladattavissa zip-pakattuina
tiedostoina sekä koko aineistosta yhteensä että
vuosikymmenittäin. Tiedostoissa n-grammit ovat frekvenssin mukaan
laskevassa järjestyksessä.

Huomaa, että osa tiedostoista on varsin suuria, erityisesti koko
aineiston bi- ja trigrammit.

Lisenssi: CC BY
Lisätietoa: http://urn.fi/urn:nbn:fi:lb-2014091902

Tuki: kielipankki@csc.fi
