
Max Wahlström kertoo meille Suomi24-aineistoon liittyvästä tutkimuksestaan. Aineiston suuri koko mahdollistaa monenlaisten ilmiöiden tarkastelun, mutta edellyttää myös kielentutkijalta harkintaa sen suhteen, mitä päätelmiä voidaan tehdä aineiston edustamasta kielimuodosta.
Olen slavisti ja kielitieteilijä. Tutkimukseni kautta tunnen maailmankolkista parhaiten Balkanin. Työskentelen vanhempana yliopistonlehtorina Helsingin yliopiston humanistisessa tiedekunnassa ja opetan bosnian, kroaatin, montenegron ja serbian kieliä ja monenlaisia useimmiten kielitieteeseen ja slavistiikkaan liittyviä kursseja.
Välillä tuntuu, että tutkin niin erilaisia aiheita, että yhteistä juonnetta kaikelle on vaikea nimetä. Kun rahoitushakemuksissa tätä vaaditaan, kerron yleensä, että olen kiinnostunut argumentin merkintään, referentiaalisuuteen ja informaatiorakenteeseen liittyvistä ilmiöistä, niiden vaihtelusta ja niiden leviämisestä kielikontakteissa. Kielessä minua kiehtoo tutkimuskohteena sen synty ihmisen toiminnan ja vuorovaikuksen tuloksena sekä siihen rakentuva säännönmukaisuus, josta puhuja ei useinkaan ole tietoinen ellei sääntöjä rikota. Juuri sääntöjä rikottaessa tai niitä venytettäessä ollaan taas lähes poikkeuksetta tekemisissä jännien asioiden kanssa. Kun uusi rakenne valtaa alaa, lainasana leviää tai ilmaus metaforistuu, kieli näyttäytyy kiinnostavimmillaan jatkuvasti muuntuvana ja sopeutuvana oliona.
Kielipankin aineistot tarjoavat minulle mahdollisuuden tarkastella ilmiöitä, jotka ovat sen verran harvinaisia, että niistä ei saa pienemmässä aineistossa käsitystä, tai joiden variaation ehdot ovat monimutkaisia esimerkiksi kielellisen kontekstin, tekstilajin tai historiallisen ajankohdan osalta. Eniten olen käyttänyt sen suuren koon vuoksi Suomi24-aineistoa. Ilman sitä somen tykkäystoimintoa käsittelevän artikkelini ilmiöitä ei olisi voinut tutkia. Ilmaisia lounaita ei kuitenkaan ole, ja kollegoitteni kanssa pohdinkin, millä ehdoin Suomi24:stä voidaan puhua korpuksena samassa mielessä kuin monesta muusta Kielipankin aineistosta. Osoitamme myös, että puheenaihe vaikuttaa dramaattisesti siihen, kuinka puhe- tai yleiskielisiä Suomi24-keskustelut ovat.
Niva, Heidi, Olli O. Silvennoinen & Max Wahlström. 2025. Mitä tutkimme, kun käytämme Suomi24-korpusta? Verkkokeskustelukorpus suomen edustajana. Virittäjä 129(4). 487–517. https://doi.org/10.23982/vir.163133.
Wahlström, Max. 2025. The “like” button and Finnish transitivity. Finnish Journal of Linguistics 38. 211–222. https://doi.org/10.61197/fjl.145021.
Makartsev, Maxim, Max Wahlström & Anastasia Escher. 2024. Lability in Balkan Slavic. Studies in Language. 1–28. https://doi.org/10.1075/sl.23062.mak.
Gijn, Rik van & Max Wahlström. 2023. Linguistic areas. Teoksessa Rik van Gijn, Hanna Ruch, Max Wahlström & Anja Hasse (toim.), Language contact: Bridging the gap between individual interactions and areal patterns, 179–219. Berlin: Language Science Press. https://doi.org/10.5281/zenodo.8269244.
Wahlström, Max & Jouko Sakari Lindstedt. 2020. Kielikontaktien tutkimus. Teoksessa Milla Luodonpää-Manni, Markus Hamunen, Reetta Konstenius, Matti Miestamo, Urpo Nikanne & Kaius Sinnemäki (toim.), Kielentutkimuksen menetelmiä I-IV (Suomalaisen Kirjallisuuden Seuran Toimituksia), 557–595. Helsinki: Suomalaisen Kirjallisuuden Seura. https://doi.org/10.21435/skst.1457.
FIN-CLARIN eli suomalaisten yliopistojen, CSC – Tieteen tietotekniikan keskuksen ja Kotimaisten kielten keskuksen muodostama konsortio auttaa ihmistieteiden tutkijoita käyttämään, jalostamaan, säilyttämään ja jakamaan tutkimusaineistoja. Aineistoja ja työkaluja tarjoaa Kielipankki.
Kaikki tähän saakka esitellyt Kielipankin käyttäjät löytyvät Kuukauden tutkija -arkistosta. Tämä artikkeli julkaistaan myös Helsingin yliopiston humanistisen tiedekunnan verkkosivuilla.