Whisper

Name: ASTIN: Language Technologies in the Nordic Countries 2026
Start: 2026-11-10T00:00:00+02:00
End: 2026-11-11T23:59:59+02:00
Location: Helsinki

Whisper is a general-purpose speech recognition model. It is trained on a large dataset of diverse audio and is also a multitasking model that can perform multilingual speech recognition, speech translation, and language identification.

Whisper home page

Whisper can be installed to a SD Desktop virtual machine with SD Software installer.

The version provided for SD Desktop is based on Faster-Whisper-XXL.

After installation, Whisper is available as a command-line tool in SD Desktop.

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2026020504

WebMAUS

This web service inputs a media file with a speech signal and a text file with a corresponding orthographic transcript, and computes a word segmentation and a phonetic segmentation and labeling.

The tools were developed at the Institute for Phonetics and Speech Processing in Munich, in the context of CLARIN-D.

For more information see the tutorial.

Access the web service

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2026020503

finnsurveytext

In English

Tämän R-paketin tarkoituksena on tarjota yhteiskuntatieteiden tutkijoille hyödyllisiä ja käyttäjäystävällisiä työkaluja, joiden avulla he voivat analysoida ja ymmärtää kyselytutkimuksissaan avoimiin kysymyksiin annettuja vastauksia.

R on tilastolaskentaan ja datan kuvantamiseen kehitetty ohjelmointikieli. R-pakettien asentaminen ja käyttö edellyttää, että R-ympäristö (tai esimerkiksi RStudio-sovellus) on asennettuna. Jos käytät CSC:n laskentaympäristöä, dokumentaatio ja ohjeita löytyy esim. https://docs.csc.fi/apps/r-env/.

Paketti on saatavilla MIT-lisenssillä. Katso lisenssin englanninkielinen teksti kokonaisuudessaan täältä.

Lisätietoja löytyy paketin kotisivulta.

Viimeisin versio:
finnsurveytext Kuvailutiedot ja lisenssi Tämän version viittausohje	Lataa työkalu
Etsi muita tämän työkalun versioita META-SHAREsta

Yksityiskohtaiset tiedot kunkin version sisällöstä, käyttöoikeuksista ja lisensseistä löytyvät META-SHAREn metatietueesta.

Tämän sivun pysyvä tunniste: http://urn.fi/urn:nbn:fi:lb-2024011203

finnsurveytext

Suomeksi

This R package aims to provide a useful and user friendly set of tools for social science researchers to be able to analyse and understand responses to open-ended questions within their surveys.

R is a programming language for statistical computing and data visualization. To install and use an R package, you first need to have an R installation (or, e.g., the RStudio application). If you like to use CSC computing environment, please see https://docs.csc.fi/apps/r-env/ for further documentation and instructions.

The package is available under the MIT license. Please see the full license text here.

For further information please visit the package’s website.

Latest versions/subcorpora:
finnsurveytext Metadata and license Attribution instructions	Download the tool

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2024011202

Tekstiks – Puheesta tekstiksi (automaattinen puheentunnistuspalvelu)

In English

Demopalvelu, jossa voi kokeilla puheen automaattista litterointia ja muokata automaattisesti tuotettua litteraattia selainkäyttöliittymän kautta.

Huom. Tämä palvelu on tarkoitettu toistaiseksi ainoastaan kokeilukäyttöön yksittäisillä äänitiedostoilla. Palvelua ei ole mitoitettu laajojen aineistojen käsittelyyn, eikä siinä tietosuojasyistä tule käsitellä luottamuksellisia puhetallenteita.

Viimeisin versio:
Tekstiks Metadata Viittaaminen	Käytä palvelua
Etsi muita tämän työkalun versioita META-SHAREsta

Mikä on Tekstiks.ee?

Tekstiks.ee on verkkoselaimella toimiva puheentunnistuspalvelu, jossa voi litteroida mm. viron- tai suomenkielistä puhetta.

Tekstiks-palvelu on osa kansainvälistä CLARIN-yhteistyötä. Litteraattien muokkaukseen tarkoitettu tekstieditori ja puheentunnistinten ajamiseen tarkoitettu käyttöliittymä on kehitettu Tallinnan teknillisen yliopiston (TalTech) kieliteknologian laboratoriossa. Palveluun on kytketty TalTechin oma viron kielen puheentunnistin sekä suomalaisen Kielipankin kautta tarjottava puheentunnistin, jonka avulla Tekstiks-palvelussa voi käyttää myös Aalto-yliopistossa kehitettyjä puheentunnistusmalleja mm. suomen kielelle.

Järjestelmässä voidaan käsitellä useita tiedostoja samanaikaisesti. Keskimääräinen tunnistusaika on noin puolet käsiteltävän äänitteen kokonaiskestosta (marraskuussa 2022). Selainkäyttöliittymässä voi valita viron sijaan myös suomen- tai englanninkielisen näkymän.

Miten Tekstiks-palvelu toimii suomenkielisellä puheella?

Aluksi käyttäjän pitää luoda paikallinen käyttäjätunnus Virossa sijaitsevalle Tallinnan teknillisen yliopiston hallinnoimalle palvelimelle. Tunnuksen luomiseen riittää toimiva sähköpostiosoite, jonka lisäksi annetaan käyttäjän nimi ja valitaan salasana. Käsiteltävät äänitiedostot ladataan Tekstiks-palvelimelle Viroon. Kirjautunut käyttäjä voi itse hallinnoida ja poistaa Tekstiks-palvelimeen lataamiaan tiedostoja.

Jos Tekstiks-palvelussa valitaan ja käynnistetään suomenkielisen puheen tunnistus, puheäänitteet siirretään verkon yli Suomeen CSC:n isännöimälle palvelimelle, jossa ne käsitellään. Tunnistettu teksti siirretään CSC:n palvelimelta takaisin Tekstiks-palvelimelle Viroon, jossa käyttäjä voi edelleen muokata tekstiä ja halutessaan ladata sen itselleen. Tällä hetkellä tuettu latausmuoto on .docx (MS Word -dokumentti).

Huomaa, että tämän testikäytössä olevan palvelun tietoturvan taso ei vielä riitä luottamuksellisen puheaineiston käsittelyyn.

Viittaaminen

Jos käytät Tekstiks-palvelua tutkimuksessasi, viittaathan julkaisuissa seuraavaan artikkeliin:
Olev, Aivo; Alumäe, Tanel. (2022) Estonian Speech Recognition and Transcription Editing Service. Baltic J. Modern Computing, Vol. 10 (3), pp. 409–421. DOI: 10.22364/bjmc.2022.10.3.14
Jos käytät Aalto-yliopistossa kehitettyä suomalaista puheentunnistinta, tarkista viittausohjeet myös sen osalta.

Tämän sivun pysyvä tunniste: http://urn.fi/urn:nbn:fi:lb-2022122021

Tekstiks – Speech recognition: speech to text

Suomeksi

A demo service where you can try out automatic speech transcription and edit the automatically generated transcript via a browser interface.

Note: For the time being, this service is intended for trial use with individual audio files only. The service is not designed to handle large amounts of data and should not be used to handle confidential speech recordings for data protection reasons.

Latest version:
Tekstiks Metadata and license Attribution instructions	Access the service

What is Tekstiks.ee?

Tekstiks.ee is a web browser-based speech recognition service for transcribing speech in Estonian or Finnish.

The Tekstiks service is part of the international CLARIN cooperation. The text editor for editing transcripts and the interface for running speech recognition tools have been developed at the Laboratory of Language Technology at the Tallinn University of Technology (TalTech). TalTech’s own speech recogniser for the Estonian language is connected to the service, as well as the speech recogniser for Finnish provided through the Language Bank of Finland, which uses speech recognition models developed at Aalto University.

The system can handle several files simultaneously. The average processing time is about half of the recording’s length (in November 2022). The language of the browser interface can be set to English or Finnish instead of Estonian.

How does Tekstiks work with Finnish speech?

First, you need to create a local username on a server managed by the Tallinn University of Technology in Estonia. To create an account, all you need is a working email address, a user name and a password. The audio files to be processed are uploaded to the Tekstiks server in Estonia. The logged-in user can manage and delete files uploaded to the Tekstiks server.

If Finnish speech recognition is selected and activated in the Tekstiks service, the speech recordings are transferred over the network to a CSC-hosted server in Finland, where they are processed. The recognised text is transferred from the CSC server back to the Tekstiks server in Estonia, where the user can further edit the text and, if they wish, download it. Currently the supported download format is .docx (MS Word document).

Please note that the level of security of this test service is currently not sufficient to handle confidential speech data.

Reference instructions

If you use the Tekstiks service in your research, please refer to the following article in your publications:
Olev, Aivo; Alumäe, Tanel. (2022) Estonian Speech Recognition and Transcription Editing Service. Baltic J. Modern Computing, Vol. 10 (3), pp. 409–421. DOI: 10.22364/bjmc.2022.10.3.14
If you are using the Finnish speech recogniser developed at Aalto University, please check the reference guidelines for that as well.

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2022112802

Praat

Praat is a free toolkit for annotating, processing and analysing speech and other audio samples in a wide range of ways. Praat also allows you to produce high-quality presentation graphics, manipulate audio samples, build observation experiments or even use speech synthesizers. For advanced users, a full scripting language and GPL-licensed source code are also available. Ready-made scripts written by Praat users can be found online for many purposes.

Praat was developed by Paul Boersma and David Weenink of the University of Amsterdam.

Latest version:
Praat Metadata and license	Access

Praat homepage

Install

Introductory tutorial to Praat

More information on Praat in Finnish

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2021110403

ELAN

ELAN is a program for transcribing and annotating audio and video files, offered by The Language Archive. It can also be used for searching locally stored collections of annotated material.

With ELAN, a user can add an unlimited number of textual annotations to audio and/or video recordings. An annotation can be a sentence, word or gloss, a comment, translation or a description of any feature observed in the media. Annotations can be created on multiple layers, called tiers. Tiers can be hierarchically interconnected. An annotation can either be time-aligned to the media or it can refer to other existing annotations. The content of annotations consists of Unicode text and annotation documents are stored in an XML format (EAF).

The program is available for Windows, Mac and Linux and source code is open for developers. Installation instructions and further details about the software can be found on the project website.

User guidelines in Finnish

User guidelines in English

Install the tool

This resource group page has a Persistent Identifier: http://urn.fi/urn:nbn:fi:lb-2021110402

Aalto-yliopiston automaattinen puheentunnistin (Aalto-ASR)

In English

Aalto-ASR eli Aalto-yliopiston automaattinen puheentunnistin on Aalto-yliopistossa kehitetty automaattinen puheentunnistusjärjestelmä, johon kuuluu kaksi toimintoa, puheentunnistin ja kohdistin. Tunnistimella voidaan tunnistaa suomenkielisestä puhetta annetusta äänitiedostosta. Tunnistuksen tulos tallentuu joko annotaatiotiedostona tai yksinkertaisena tekstitiedostona. Jos puhetta sisältävästä äänitiedostosta on jo tehtynä tekstimuotoinen litteraatti, siinä olevat sanat voidaan kohdistimen avulla automaattisesti kohdistaa vastaaviin äänitiedoston kohtiin. Kohdistin toimii suomen lisäksi useilla muillakin kielillä.

Aalto-yliopiston automaattinen puheentunnistin (Aalto-ASR), versio 2.1
Kuvailutiedot, lisenssi ja viittausohje
Tunnistimen käyttöohje
Lähdekoodi

Ajankohtaista

Kielipankkiin on syyskuussa 2021 asennettu Aalto-ASR:stä uusi versio 2.1, joka on käytettävissä CSC:n Puhti-laskentaympäristössä. Lisäksi Aalto-ASR on tarjolla myös Docker-säiliönä, jonka voi tarvittaessa asentaa omalle koneelle tai muuhun ympäristöön.

Aalto-ASR:n edellisen version 1 joitakin osia oli aikaisemmin mahdollista käyttää myös Kielipankin Mylly-palvelun kautta. Vanha Aalto-ASR 1.0 -versio on kuitenkin Taito-palvelimen mukana poistunut käytöstä vuonna 2020. Uutta versiota 2 ei toistaiseksi ole kytketty Myllyyn.

Tämän aineistoryhmäsivun PID: http://urn.fi/urn:nbn:fi:lb-2021101112

Last modified on 2022-11-10

Search the Language Bank Portal:

Researcher of the Month: Mari Myllylä

Contact

The Language Bank's technical support:
kielipankki (at) csc.fi
tel. +358 9 4572001

Requests related to language resources:
fin-clarin (at) helsinki.fi
tel. +358 29 4129317

More contact information

Whisper

WebMAUS

finnsurveytext

finnsurveytext

Tekstiks – Puheesta tekstiksi (automaattinen puheentunnistuspalvelu)

Mikä on Tekstiks.ee?

Miten Tekstiks-palvelu toimii suomenkielisellä puheella?

Viittaaminen

Tekstiks – Speech recognition: speech to text

What is Tekstiks.ee?

How does Tekstiks work with Finnish speech?

Reference instructions

Praat

ELAN

Aalto-yliopiston automaattinen puheentunnistin (Aalto-ASR)

Ajankohtaista

News

Contact