Suomen kielen puupankki (FTB) (finntreebank)

In English


Saatavilla olevat versiot

LyhenneNimi ja kuvailutiedotLisenssiSijaintiViiteAineistoryhmä ja ohjeHae käyttöoikeuttaJulkaisuvuosiTukitaso
LyhenneNimi ja kuvailutiedotLisenssiSijaintiViiteAineistoryhmä ja ohjeHae käyttöoikeuttaJulkaisuvuosiTukitaso

Tietoa aineistosta

FTB-aineiston eri versioihin kuuluvat suomen kielen puupankit ja jäsennyspankit on luotu FinnTreeBank-projektissa. FinnTreeBank 1 -aineisto perustuu Iso suomen kielioppi  -teoksen mallilauseisiin, jotka on käsin annotoitu dependenssisyntaktisilla kuvauksilla (ks. merkintätavat ja annotointikäsikirja). FinnTreeBank 1 on  rakennettu alun perin kieliopin määritelmäkorpukseksi ja se on tarkoitettu malliksi suomen kielen automaattiseen analyysiin. FinnTreeBank 2 on pieni laajennus FinnTreeBank 1:een, ja se on annotoitu käsin samalla tavalla kuin ensimmäinen puupankki. FinnTreeBank 3 on laajempi puupankki, joka on annotoitu kokeellisella menetelmällä pelkästään automaattisesti. Tämän seurauksena kolmannen puupankin jäsennystulos on laadultaan selvästi heikompi kuin manuaalisesti annotoiduissa puupankeissa.

FinnTreeBank 1:n UD-versio on tuotettu vuonna 2014 FinnTreeBank 1:stä siten, että alkuperäiset jäsennysmerkinnät on pyritty skriptin avulla yhdistelemään niiden likimääräisiin vastineisiin suomen kielen Universal Dependencies -mallissa (ks. lisätietoa suomen puupankista UD-projektin sivuilla).

Kunkin aineistoversion tarkemmat tiedot päivitetään kuvailutietueeseen, joka löytyy pysyvällä tunnisteella (ks. linkki aineiston otsikon kohdalla).

Annotation details

Lisenssi ja pääsy aineistoon

  • Kaikki tämän aineiston versiot ovat saatavilla julkisesti (PUB).
  • Lisenssikuvaketta napauttamalla näet tarkan aineistokohtaisen lisenssin.

FinnTreeBank-hankkeeseen liittyviä julkaisuja

 


Tämän sivun pysyvä tunniste: http://urn.fi/urn:nbn:fi:lb-2025092221

Viimeksi muokattu 2026-01-30