
| Lyhenne | Nimi ja kuvailutiedot | Lisenssi | Sijainti | Viite | Aineistoryhmä ja ohje | Hae käyttöoikeutta | Julkaisuvuosi | Tukitaso |
|---|---|---|---|---|---|---|---|---|
| Lyhenne | Nimi ja kuvailutiedot | Lisenssi | Sijainti | Viite | Aineistoryhmä ja ohje | Hae käyttöoikeutta | Julkaisuvuosi | Tukitaso |
FTB-aineiston eri versioihin kuuluvat suomen kielen puupankit ja jäsennyspankit on luotu FinnTreeBank-projektissa. FinnTreeBank 1 -aineisto perustuu Iso suomen kielioppi -teoksen mallilauseisiin, jotka on käsin annotoitu dependenssisyntaktisilla kuvauksilla (ks. merkintätavat ja annotointikäsikirja). FinnTreeBank 1 on rakennettu alun perin kieliopin määritelmäkorpukseksi ja se on tarkoitettu malliksi suomen kielen automaattiseen analyysiin. FinnTreeBank 2 on pieni laajennus FinnTreeBank 1:een, ja se on annotoitu käsin samalla tavalla kuin ensimmäinen puupankki. FinnTreeBank 3 on laajempi puupankki, joka on annotoitu kokeellisella menetelmällä pelkästään automaattisesti. Tämän seurauksena kolmannen puupankin jäsennystulos on laadultaan selvästi heikompi kuin manuaalisesti annotoiduissa puupankeissa.
FinnTreeBank 1:n UD-versio on tuotettu vuonna 2014 FinnTreeBank 1:stä siten, että alkuperäiset jäsennysmerkinnät on pyritty skriptin avulla yhdistelemään niiden likimääräisiin vastineisiin suomen kielen Universal Dependencies -mallissa (ks. lisätietoa suomen puupankista UD-projektin sivuilla).
Kunkin aineistoversion tarkemmat tiedot päivitetään kuvailutietueeseen, joka löytyy pysyvällä tunnisteella (ks. linkki aineiston otsikon kohdalla).
Tämän sivun pysyvä tunniste: http://urn.fi/urn:nbn:fi:lb-2025092221
Viimeksi muokattu 2026-01-30