Työkalut

In English

På svenska

Kielipankin ylläpitämät työkalut ja palvelut voivat olla käytettävissä verkkosivustolla tai ladattavissa omalle koneelle latauspalvelusta (esim. GitHub tai Korp). Tältä sivulta löydät myös muita FIN-CLARINin tai CLARIN ERICin jäsenorganisaatioiden kehittämiä työkaluja.

Tukitasot

Kielipankin aineistoilla on kolme tukitasoa.

A: Kielivaraa kehitetään ja parannetaan aktiivisesti. Kielipankki korjaa aineistoon liittyvät ongelmat mahdollisimman nopeasti.
B: Kielivaraa kehitetään ainoastaan käyttäjien pyynnöstä. Kielipankki pyrkii korjaamaan ongelmia, mutta se saattaa edellyttää ulkopuolista työpanosta.
C: Kielivara on saatavilla sellaisenaan. Kielipankki ei korjaa eikä kehitä aineistoa.

Etsi muita saatavilla olevia työkaluja: META-SHARE, CLARIN Virtual Language Observatory (VLO)

Please find an overview of all our resources sorted by resource families on Resource families Fin-Clarin.

Käynnistä työkaluNimiKuvausOhjeetAsentaminenInfoYlläpitäjäTukitaso
Kielipankin Korp-palveluKorpSelainpohjainen konkordanssityökalu, jolla voi tehdä hakuja tekstiaineistoista morfosyntaktisen jäsennyksen perusteella.Ohjeeticon-question-circleA
LatausLatauspalveluLataa aineistoja omalle koneellesi.icon-question-circleKielipankkiA
META-SHAREMETA-SHAREKielipankin kielivarojen kuvailutietovaranto.icon-question-circleKielipankkiA
MyllyMyllyAineistojen käsittelyalusta.Ohjeeticon-question-circleKielipankkiC
SanatSanatSanastojen ja luetteloiden julkaisemispalvelu.icon-question-circleKielipankkiB
FinTagFinnish TagtoolsSuomenkielisen tekstin morfologinen taggeri ja nimentunnistus.Asennus,
Docker-käyttö
icon-question-circleKielipankkiA
DemoKielipankin työkaludemojaKokoelma työkaluja ja resursseja, joita jalostetaan virallisempaan käyttöön: FinTag ja FiNER, FinSentiment, FinnWordNet, HFST:n POS-taggerit, HFST:n morfologiset jäsentimet, Lemmamatch jne.KielipankkiC
WebAnnoAnnotaatiotyökalu.User
Guide
(engl.)
Standalone
installation
(engl.)
icon-question-circleKielipankkiA
SignbankSuomalaisen viittomakielen leksikkotietokanta.icon-question-circleJyväskylän yliopistoA
OPUSAvoin rinnakkaisaineisto.icon-question-circleHelsingin yliopisto
Tieteen termipankkiKaikkien Suomessa harjoitettavien tieteenalojen yhteinen, avoin ja jatkuvasti päivitettävä termitietokanta tiedeyhteisön ja kansalaisten käyttöön.icon-question-circleHelsingin yliopistoA
LääketutkaLääketutka tarjoaa analytiikkaa terveyteen, lääkkeisiin ja oireisiin liittyvistä Suomi24-keskustelufoorumin keskusteluista.icon-question-circleHelsingin yliopistoC
ANEE Lex­ical NetworksANEE Lex­ical NetworksANEE:n leksikaalinen portaali on graafinen semanttinen sanakirja, joka on esitetty verkostona. Portaalissa voi tutkia yksikkömuotoisten akkadinkielisten sanojen merkityksiä visuaalisella tavalla.icon-question-circleHelsingin yliopisto
Proto-Indo-European LexiconIndoeurooppalaisten kielten generatiivinen etymologinen sanakirja.icon-question-circleHelsingin yliopisto
WancaWancaWanca on uralilaisten kielten portaalisivusto. icon-question-circleHelsingin yliopistoA
Turku Neural Parser
Pipeline
Turku Neural Parser PipelineTurku NLP -ryhmän kehittämä suomen kielen jäsennystyökalu.Asennus (GitHub)icon-question-circleTurun yliopisto
word2vecSemantic similarity of words (word2vec)Turku NLP -ryhmän kehittämä työkalu, jolla voidaan tutkia semanttista samankaltaisuutta.icon-question-circleTurun yliopisto
Finnish Internet Parsebank:
SETS
Syntax-based search (SETS)
from the Finnish Internet Parsebank
Syntaksiin perustuva haku Finnish Internet Parsebankin osasta.DokumentaatioTurun yliopisto
FinBERTFinBERTSuomelle harjoitettu BERT malli.Asennus(GitHub)icon-question-circleTurun yliopisto
TexthammerTexthammerTampereen yliopiston tuottamien rinnakkaisaineistojen haku- ja analyysipalveluOhjeet (PDF)icon-question-circleTampereen korkeakouluyhteisö
nimiarkisto.fiNimiarkistoNimiarkisto.fi on paikka, johon kootaan digitaalisessa muodossa Suomesta kerätyt ja arkistoidut keskeiset nimiaineistot. icon-question-circleKotimaisten kielten keskus
Terminology ForumTerminology ForumTerminology Forum – Eri alojen sanastojen linkkikokoelma, Vaasan yliopistoicon-question-circleVaasan yliopisto
SparvSparvRuotsin Språkbankenin työkalupakki monikielisten tekstiaineistojen jäsentämiseen.Käyttöohjeet (GUI)Asennusohjeeticon-question-circleSWE-CLARIN (Språkbanken)
WebMAUSWebMAUSTyökaluja puheen automaattiseen segmentaatioon ja annotointiin.Ohje
TranskribusTranskribusTyökaluja historiallisten dokumenttien (esim. kuvien ja skannattujen tekstien) transkriptioon, annotointiin ja hallintaan.Ohjeet (PDF)Asennusicon-question-circleUniversity of Innsbruck
Aalto-ASRAalto University Automatic
Speech Recognition System
Puheentunnistin, jota voi käyttää CSC:n laskentaympäristössä sekä rajoitetusti myös Mylly-palvelun kautta.OhjeetAsennus (GitHub)icon-question-circleAalto-yliopisto
ELANELANELAN on ohjelma, jolla voi litteroida ja annotoida ääni- ja videotiedostoja. Sillä voi myös tehdä hakuja paikallisesti tallennetuista annotoiduista aineistoista.OhjeetAsennusicon-question-circleThe Language Archive
PraatPraatPraat on kattava työkalupakki puheen ja muiden ääninäytteiden annotointiin, käsittelyyn, kuvantamiseen ja analyysiin. Praat sisältää oman skriptikielen.OhjeetAsennusicon-question-circleUniversity of Amsterdam
CLARIN Federated Content SearchHae keskitetysti kaikkien CLARIN-keskusten aineistoista.icon-question-circleCLARIN ERIC
GephiGephiOhjelma verkkoanalyysiin ja visualisointiin.Asennus
Kielipankin LAT-palveluLAT (Language Archive Tools)Annotoitujen ääni- ja videoaineistojen selailun, hakujen ja jakamisen työkalupakki.
Huom: LAT-palvelu lakkautettiin Kielipankissa 30.11.2020 mennessä, ks. lisätiedot!
OhjeetC
digi.kansalliskirjasto.fiDigitaaliset aineistotKansalliskirjaston palvelu, jossa voi tehdä hakuja digitaalisista kokoelmista ja ladata sisältöjä omalle koneelle. Sanoma- ja aikakauslehtien lisäksi Digissä on myös mm. kirjoja, kuvia, karttoja, nuotteja jne. Huomaa, että suuri osa lehtiaineistoista on käytettävissä myös Kielipankin Korp-palvelun kautta (ks. KLK).icon-question-circleKansalliskirjasto
textreuse.sls.fiTekstin kierrätys ruotsinkielisessä lehdistössä 1645-1918Hakukone, jolla voi etsiä ja analysoida useaan kertaan esiintyviä tekstikatkelmia ja niistä muodostuvia klustereita ruotsinkielisissä lehdissä vuosina 1645-1918.icon-question-circle
FinnONTOFinnONTOFinnish and international ontologies, vocabularies and thesauri needed for publishing content cost-efficiently on the Semantic Web.icon-question-circle
Kielitoimiston sanakirjaKielitoimiston sanakirjaKielitoimiston sanakirja on Kotimaisten kielten keskuksessa laadittu suomen yleiskielen sanakirja.icon-question-circleInstitute for the Languages of Finland
HeLI-OTS 1.4HeLI-OTS 1.4HeLI-menetelmään perustuva kielentunnistin valmiilla kielimalleilla 200 kielelle.icon-question-circleHelsingin yliopisto
Kotus digitaaliset aineistotKotuksen digitaaliset aineistotKotuksen vapaasti käytettävät verkkoaineistot kootusti.icon-question-circleInstitute for the Languages of Finland
GiellateknoGiellateknoSanakirjat ja työkalut saamen ja muiden morfologialtaan rikkaiden kielten kielitieteellisen ja kieliteknologisen tutkimukseen.icon-question-circle
FinMeterFinMeter - Työkaluja suomenkielisen runouden analysointiinFinMeter on kirjasto suomenkielisen runouden analysointiin. Se käsittelee tyypillistä riimittelyä, kuten allitteraatiota, assonanssia ja konsonanssia, japanilaista metriikkaa ja Kalevalan metriikkaa. Sitä voidaan käyttää myös suomen kielen yhdyssanoihin ja metrin analysointiin. Lisäksi sillä voidaan tehdä semanttista klusterointia, metaforatulkintaa, konkretiapisteytystä ja sentimenttianalyysiä.Helsingin yliopisto
MurreMurreMurre-työkalulla voi kirjakielistää/yleiskielistää tekstimuotoista puhekielistä suomea. Murrea ylläpitää Mika Hämäläinen.Helsingin yliopisto
UralicNLPUralicNLP - Luonnollisen kielen käsittelyä monilla eri kielilläUralicNLP:llä voi tuottaa tekstistä morfologisia analyyseja, generoida morfologisia muotoja, perusmuotoistaa sanoja ja saada leksikaalista tietoa sanoista uralilaisissa ja muissa kielissä. Toiminnallisuudet pohjautuvat pääosin FST-työkaluihin sekä GiellaLT-infrastruktuurissa ja Apertiumissa tuotettuihin sanakirjoihin.Helsingin yliopisto
AnnifAnnifAnnif on Kansalliskirjastossa kehitettävä avoimen lähdekoodin työkalu, jolla voi automaattisesti etsiä asiasanoja tekstille.Kansalliskirjasto
tekstiks.eetekstiks.ee – Puheentunnistus: puheesta tekstiksiAutomaattisen puheentunnistuksen palvelu viron ja suomen kielille sekä käyttöliittymä transkription muokkaamiseen.icon-question-circle

Vastaa