9.3.2021

Helsingin yliopiston englanninkielinen E-thesis 1999-2016 on päivitetty versioon 1.1. Gradu- ja väitöskirjakorpuksiin on tehty seuraavia muutoksia:

  • Aineisto on jäsennetty Turku Neural Parser Pipeline (TNPP) -jäsentimellä.
  • Tekstit, joissa on vähemmän kuin 1000 sanaa on jätetty pois.
  • Tekstit, joissa on enemmän kuin 1000 sanaa on otettu mukaan vain jos niistä löytyy tarpeeksi englanninkielisiä sanoja.
  • Korpus ethesis_en_phd_math on uudelleennimetty ethesis_en_phd_sci:ksi.

Tiivistelmäkorpuksiin (ethesis_en_dissabs ja ethesis_en_maabs) ei ole tehty muutoksia.