
Korp päivitetty Korp-tekstikorpushakupalvelu on päivitetty uuteen versioon 4.0. Lataa selaimessa Korp-sivu uudelleen saadaksesi päivitetyn version käyttöösi. (Tarvittaessa tyhjennä selaimen välimuisti ja käynnistä selain uudelleen.)
Uutisia Kielipankista 30.4.2015
Yli kolmen miljoonan sanan puheaineisto nyt verkossa 31.3.2015 Verkossa on nyt joustavasti katsottavissa ja kuunneltavissa yli kolmen miljoonan sanan puheaineisto. Julkaistavista aineistoista voi tehdä sanojen ja sananmuotojen perusteella hakuja, joiden […]
Uutisia Kielipankista 16.3.2015
Ghost-tietoturva-aukko paikattu Kielipankin palvelimilla Linux-pohjaisissa käyttöjärjestelmissä käytettävästä GNU C -kirjastosta (glibc) on löytynyt turva-aukko, jolle annettiin nimeksi Ghost. Turva-aukkoa pidettiin aluksi hyvin laajana ja vakavana, mutta sen kautta palvelimiin kohdistuvien […]
NooJ-ohjelmaa käsittelevä kirja ilmestyi NooJ on ohjelma, jolla voi rakentaa ja käyttää joko valmiita tai eriasteisia itse rakennettuja kielioppeja tekstiaineiston jäsentämiseen ja annotointiin sekä kieliopillisten rakenteiden etsimiseen tekstin joukosta. Nyt […]
Uutisia Kielipankista 8.12.2014
Suru-uutinen Mukava ja erittäin taitava kollegamme, FIN-CLARINin juridinen neuvonantaja Ville Oksanen menehtyi sunnuntaina 23.11. äkilliseen sairauteen. Oksanen puolusti ansiokkaasti kansalaisten digitaalisia oikeuksia niin Suomessa kuin koko Euroopassa. Hän piti poliittisessa […]
Korpissa 5 miljardia sanaa suomea FIN-CLARINin Kielipankin kautta voit hakea virkkeitä viiden miljardin sanan suomen kielen korpuksesta. Käytössä on ensimmäinen versio korpuksesta, joka perustuu Kansalliskirjaston skannaamiin lehti- ja aikakauslehtiteksteihin 1820-luvulta […]
Suomenkielinen Gutenberg -korpus Korpissa Suomenkielinen Gutenberg-korpus on avattu julkiseen käyttöön Korpissa. Yli 34 miljoonaa sanetta sisältävän korpuksen teosluettelo löytyy osoitteesta http://urn.fi/urn:nbn:fi:lb-2014102102.
Uutisia Kielipankista 20.10.2014
Kansalliskirjaston sanoma- ja aikakauslehtikokoelman ruotsinkieliset n-grammit ladattavissa Kansalliskirjaston sanoma- ja aikakauslehtikokoelman ruotsinkieliset n-grammit 1770-1940 ovat nyt ladattavissa vuosikymmenittäin osoitteesta http://www.helsinki.fi/finclarin/snc1. Korpuksen virkkeitä voi tutkia Korpissa https://korp.csc.fi.
Uutisia Kielipankista 22.8.2014
Suomen kielen näytteitä -murrekorpus julkaistiin LAT-alustalla vapaaseen käyttöön Kotimaisten kielten keskuksen tuottaman Suomen kielen näytteitä -korpuksen ensimmäinen versio Kielipankin LAT-alustalla on avattu julkiseen käyttöön. SKN-korpus sisältää reilut 100 tuntia murrehaastatteluäänitteitä, […]
Hakutulosten lataaminen Korpissa Korpissa (korp.csc.fi) voi nyt ladata hakutuloksia omalle koneelle useassa eri tiedostomuodossa. Latauspainikkeet löytyvät hakutulosten alapuolelta. Aiemman JSON-muodon lisäksi vaihtoehtoina ovat nyt CSV, CSV+, Excel, TSV ja Text. […]
Heartbleed-haavoittuvuus on paikattu Kielipankin palvelimilla Maanantaina 7.4.2014 paljastui poikkeuksellisen laaja, Heartbleed-niminen tietoturva-aukko (ks. http://heartbleed.com/), joka koski myös niitä Kielipankin palvelimia, joilla on käytössä HTTPS-suojaus, eli lat.csc.fi, korp.csc.fi sekä kitwiki.csc.fi (Kielipankin […]
Uutisia Kielipankista 7.4.2014
Kielipankin uusi pysyväistunnisteratkaisu Kielipankissa on otettu käyttöön uusi URN-teknologiaan (Uniform Resource Name) pohjautuva pysyväistunnistejärjestelmä kielivarojen pitkäaikaisen saavutettavuuden parantamiseksi. Ajatuksena on, että kullakin kielivaralla on jatkossa oma tunnisteensa, jonka avulla täsmälleen […]
Uutisia Kielipankista 3.2.2014
Korpissa yli 3 miljardia sanaa ruotsia FIN-CLARINin Kielipankin kautta voit hakea virkkeitä yli kolmen miljardin sanan ruotsin kielen korpuksesta. Korpus perustuu Kansalliskirjaston skannaamiin lehti- ja aikakauslehtiteksteihin 1770-luvulta eteenpäin. https://korp.csc.fi/?mode=swedish# Palvelu […]
| < Aiemmat uutiset | Tuoreemmat uutiset > |