Korpin korpusannotaatio: FinnTreeBank (FTB)

Seuraavassa kuvataan FinnTreeBank (FTB) -korpusten saneiden piirteet. Näiden puupankkiaineistojen morfologinen annotaatio on alun perin pohjautunut OMorFi-työkalun tuottamiin tageihin (ks. lyhenteet sarakkeessa FTB 3.1). Alkuperäisen mallipuupankin (FTB1 ja FTB2) annotaatio on kuitenkin tuotettu käsin. Puupankissa käytetty annotaatio on kuvattu tarkemmin annotaatiomanuaalissa, joka löytyy Puupankki-hankkeen verkkosivuilta.

Saneiden piirteet (attribuutit)

nimi merkitys
word sananmuoto (pintamuoto)
lemma sanan perusmuoto
lemmacomp sanan perusmuoto, johon on merkitty yhdyssanaraja (#)
pos sanaluokka
msd morfologinen analyysi (morfosyntaktinen kuvaus)
ref sanan järjestysnumero virkkeen sisällä
dephead pääsanan järjestysnumero virkkeen sisällä
deprel dependenssirelaatio suhteessa pääsanaan

Sanaluokkakoodit

koodi merkitys (Korpissa näkyvä nimitys)
A adjektiivi
Abbr lyhenne
Adp adpositio
Adv adverbi
AgPrc agenttipartisiippi
CC rinnastuskonjunktio
CS alistuskonjunktio
Forgn vierassana
Interj interjektio
N substantiivi
NegPrc kieltopartisiippi
Num numeraali
PrfPrc partisiipin perfekti
Pron pronomini
PrsPrc partisiipin preesens
Punct välimerkki
TrunCo yhdyssanan osa
Unkwn tunnistamaton
V verbi

Dependenssirelaatiokoodit

koodi merkitys (Korpissa näkyvä nimitys)
advl adverbiaali
attr attribuutti
aux apuverbi
comp komplementti
conjunct konjunkti
idiom idiomi
main pääverbi
mod modifioija
modal modaaliverbi
obj objekti
phrm lausekemerkitsin
phrv fraasiverbi
scomp subjektin komplementti
subj subjekti
voc puhuttelu
_ muu

 

Hae Kielipankki-portaalista:
Kuukauden tutkija: Maija Saviniemi

 

Tulevat tapahtumat

  1. Kurssi: Puheen analyysin perusteet

    28.10.201913.12.2019
  2. Course: Data Clinic 2019-20

    1.11.201917.4.2020

Yhteystiedot

Kielipankin tekninen ylläpito:
kielipankki (ät) csc.fi
p. 09 4572001

Aineistoihin ja muuhun sisältöön liittyvät asiat:
fin-clarin (ät) helsinki.fi
p. 029 4140599 / 029 4129317