Myllyn työkalu: VRT Manipulation / Validate VRT document
in English

VRT-dokumentin validointi

Työkalu tarkistaa erinäisiä seikkoja VRT-muotoiseksi aiotusta dokumentista ja laatii siitä raportin.

Parametreilla voi valita, kuinka yksityiskohtainen raportista tulee.

level
error, warning, tai info (oletuksena warning) —
error-tasolla raportoidaan vain varsinaisista
virheistä; info-tasolla raportoidaan myös seikoista,
jotka eivät ole ollenkaan ongelmia vaan ovat muuten
hyödyllisiä tietää
verbosity
verbose tai summary (oletuksena verbose) —
verbose-tasolla raportoidaan jokaisen raportoitavan
seikan jokaisen esiintymän rivinumero; summary-tasolla
raportoidaan esiintymien lukumäärät mutta vain
ensimmäisen esiintymän rivinumero

Esimerkki

Oletetaan, että seuraavan dokumentin on tarkoitus olla VRT-muotoinen.

    <!DOCTYPE html>
    <text license="not
    to make nay use of this data">
    <sentence>
    five
    years
    <sentence>
  

Dokumentti on väärällään ongelmia: Ensimmäinen rivi alkaa ”vasemmalla kulmasululla” (pienempi kuin -merkillä) mutta ei ole elementin alku- tai loppumerkintä eikä kommentti. Toinen ja kolmas rivi olisivat kelvollinen text-elementin alkumerkintä yhtenä rivinä, mutta kahtena rivinä kumpikaan niistä ei ole kelvollista VRT:tä. Toisen sentence-elementin alkumerkinnän pitäisi olla loppumerkintä — tai ehkä todellinen virhe on jotain ihan muuta, kuten useamman rivin puuttuminen kyseisessä kohdassa. Ja loppumerkinnät puuttuvat sekä text-elementiltä että sentence-elementiltä.

Dokumentissa näyttää myös olevan kirjoitusvirhe (”nay”pitäisi ehkä olla ”any”), ja lainopillisesti ei ehkä ole perusteltua yrittää kieltää tämän aineiston käyttöä yhtään mihinkään. Tällaisia seikkoja validaattori ei tarkista.

Validointiraportti on seuraavanlainen taulukko, jossa jokainen rivi ilmaisee yhden havaitun seikan ja viittaa rivinumerolla sen esiintymään dokumentissa. Ongelmallista sisältöä ei näytetä raportissa. (Aikaisemmat yritykset ovat opettaneet, että ongelmatapausten sisällyttäminen raporttiin tekee raportin lukemisen työlääksi. Eräät ongelmat voivat myös olla ongelmallisia näyttää.)

line kind level issue
1 form error malformed tag
2 form error malformed tag
3 data error bare angle
7 nest error element already open: sentence
8 nest error element not closed: sentence

Raportin ”bare angle” viittaa ”oikeaan kulmasulkuun” (suurempi kuin -merkkiin), joka sisältörivillä pitäisi koodata muotoon &gt;. Validaattori tulkitsee kyseisen rivin sisältöriviksi, koska se ei ala vasemmalla kulmasululla.

Tässä raportissa validaattori ei ole tunnistanut text-elementin alkumerkintää. Siksi se ei myöskään havaitse, että vastaava loppumerkintä puuttuu.

Rivi 8, jossa puuttuvat loppumerkinnät havaitaan, on yhden rivin verran dokumentin ulkopuolella.

Raportti saattaa poiketa tässä esitetystä riippuen siitä, mikä nimenomainen versio validaattorista on käytössä.

Muita työkaluja

  • JOSKUS

Katso myös

Hae Kielipankki-portaalista:
Harri Uusitalo
Kuukauden tutkija: Harri Uusitalo

 

Tulevat tapahtumat


Yhteystiedot

Kielipankin tekninen ylläpito:
kielipankki (ät) csc.fi
p. 09 4572001

Aineistoihin ja muuhun sisältöön liittyvät asiat:
fin-clarin (ät) helsinki.fi
p. 029 4129317

Tarkemmat yhteystiedot