15.10.2019

Kuukauden tutkija: Viljami Haakana

Viljami Haakana - kuva: Mika Federley
Kuva: Mika Federley

 

Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Helsingin yliopiston maisterivaiheen opiskelija ja tutkimusavustaja Viljami Haakana kertoo, miten hän hyödyntää Kielipankin aineistoa Lauseopin arkiston murrekorpusta.

Kuka olet?

Olen Viljami Haakana, kuudennen vuoden yleisen kielitieteen opiskelija Helsingin yliopistossa ja apulaisprofessori Kaius Sinnemäen tutkimusavustaja projektissa, joka liittyy hänen johtamaansa laajempaan ERC-hankkeeseen Linguistic Adaptation (GramAdapt). Osuuteni projektissa on pääosin aineistojen käsittelyyn liittyvää koodausta.

Mikä on tutkimuksen aihe?

Projektin tavoitteena on selvittää, esiintyykö monikon kolmannen persoonan –vat/-vät-pääte tai sen murrevastine todennäköisemmin he-pronominin jälkeen kuin ne-pronominin jälkeen. Predikaatin lukukongruenssia subjektin kanssa on fennistiikassa tutkittu vuosikymmeniä, mutta ei meidän tietääksemme siitä näkökulmasta, esiintyykö lukukongruenssia enemmän he– tai ne-pronominin kanssa.

Miten Kielipankki liittyy tutkimukseen?

Tutkimus tehdään Lauseopin arkiston murrekorpuksen avulla, alustavasti Korp-versiolla Lauseopin arkiston murrekorpuksen Helsinki-Korp-versio ja sen jälkeen latauspalvelussa olevalla versiollaLauseopin arkiston murrekorpuksen Helsinki ladattava versio, eli etsitään sieltä tapaukset, joissa subjektia he tai ne (tai niiden murrevastinetta esim. hyö, nee jne.) seuraa predikaatti kolmannessa persoonassa, yksikössä tai monikossa. Esiintymät jaetaan neljään luokkaan sen mukaan, kumpi pronomini siellä on ja onko siellä lukukongruenssia vai ei. Olen koodannut Python-skriptin, joka etsii tuollaiset tapaukset latauspalvelun kautta saatavilla olevasta korpuksesta ja kirjoittaa ne tiedostoon. Lisäksi skripti etsii esiintymiin liittyvää sosiolingvististä tietoa esimerkiksi puhujan iästä, murrealueesta ja sukupuolesta. Esiintymiä löytyy aineistosta noin 7000 kappaletta. Yleisellä tasolla tutkimuksen tarkoituksena on selvittää predikaatin lukukongruenssin vaihteluun vaikuttavia kielen rakenteellisia ja sosiolingvistisiä tekijöitä.

Aineistoon liittyviä julkaisuja

Ikola, Osmo, Ulla Palomäki & Anna-Kaisa Koitto 1989. Suomen murteiden lauseoppia ja tekstikielioppia. Suomalaisen Kirjallisuuden Seuran Toimituksia 511. Helsinki: Suomalaisen Kirjallisuuden Seura.
Väänänen, Milja 2016. Subjektin ilmaiseminen yksikön ensimmäisessä persoonassa: Tutkimus suomen vanhoista murteista. Annales Universitatis Turkuensis C 430. Turku: Turun yliopisto. https://www.utupub.fi/bitstream/handle/10024/127269/AnnalesC430Vaananen.pdf?sequence=2&isAllowed=y

 

FIN-CLARIN eli suomalaisten yliopistojen, CSC – Tieteen tietotekniikan keskuksen ja Kotimaisten kielten keskuksen muodostama konsortio auttaa humanististen tieteiden tutkijoita käyttämään, jalostamaan, säilyttämään ja jakamaan tutkimusaineistoja. Aineistoja ja työkaluja tarjoaa Kielipankki.

Kaikki toistaiseksi esitellyt Kielipankin käyttäjät löytyvät Kuukauden tutkija -arkistosta. Tämä artikkeli julkaistaan myös Helsingin yliopiston humanistisen tiedekunnan verkkosivuilla.