Bendrinės lietuvių kalbos daiktavardžių ir būdvardžių kirčiavimo struktūrinis modelis, algoritmas ir realizacija

Authors

  • Gailius Raškinis Vytauto Didžiojo universitetas
  • Giedrius Norkevičius Vytauto Didžiojo universitetas
  • Asta Kazlauskienė Vytauto Didžiojo universitetas

Abstract

Lietuvių kalbos vardažodžių (ir ne tik jų) kirčiavimas išsamiai išanalizuotas, neblogai kodifikuotas ir aprašytas daugelio lietuvių kalbininkų, tam skirta ne viena įvairaus pobūdžio knyga ar vadovėlis. Vis dėlto kalbos technologijų darbuose pasigendama išsamaus struktūrinio lietuvių kalbos kirčiavimo modelio, be kurio neįmanomi kokybiški šnekos sintezės programiniai produktai, negalima parengti modernių kompiuterinių mokomųjų kirčiavimo programų, kalbos vartotojai neturi šiuolaikinių galimybių greitai pasitikrinti, ar taisyklingai kirčiuoja konkrečius žodžius. Pranešime pristatoma tik viena mūsų kuriamos kompiuterinės programos dalis – veikiantis daiktavardžių ir būdvardžių kirčiavimo algoritmas ir svarbiausia jo sudedamoji dalis – formalizuota kirčiavimo taisyklių medžių struktūra. Aptariamos pagrindinės problemos, kurios iškilo įprastas lingvistines taisykles pritaikant kuriamuose algoritmuose. Nagrinėjama sąveika su morfologinės ir leksinės informacijos duomenų bazėmis. Pateikiami preliminarūs programos testavimo rezultatai ir jų gerinimo būdai. Analizuojamas galimybės, leisiančios patobulinti kai kurias programos dalis. Darbe pristatomas veikiantis daiktavardžių ir būdvardžių kirčiavimo algoritmas ir svarbiausia jo sudedamoji dalis – formalizuota medžio pavidalo kirčiavimo taisyklių struktūra. Pateikiami struktūrinio modelio sudarymo principai, pagrindžiamas jo tinkamumas kurti automatinio lietuvių kalbos kirčiavimo algoritmus. Aptariamos pagrindinės problemos, kurios iškilo įprastas lingvistines taisykles pritaikant kuriamuose algoritmuose. Nagrinėjama sąveika su morfologinės ir leksinės informacijos duomenų bazėmis. Pateikiamas preliminarus automatinio kirčiavimo tikslumo įvertinimas, gautas kirčiuojant daugiau nei 24 mln. daiktavardžių beveik 8 mln. būdvardžių, esančių VDU tekstyne, ir kirčiavimo tikslumo gerinimo būdai. Analizuojamos galimybės, leisiančios patobulinti kai kurias algoritmo dalis.

Downloads

Published

2004-12-15

Issue

Section

COMPUTATIONAL LINGUISTICS