Bendrinės lietuvių kalbos daiktavardžių ir būdvardžių kirčiavimo struktūrinis modelis, algoritmas ir realizacija
Abstract
Lietuvių kalbos vardažodžių (ir ne tik jų) kirčiavimas išsamiai išanalizuotas, neblogai kodifikuotas ir aprašytas daugelio lietuvių kalbininkų, tam skirta ne viena įvairaus pobūdžio knyga ar vadovėlis. Vis dėlto kalbos technologijų darbuose pasigendama išsamaus struktūrinio lietuvių kalbos kirčiavimo modelio, be kurio neįmanomi kokybiški šnekos sintezės programiniai produktai, negalima parengti modernių kompiuterinių mokomųjų kirčiavimo programų, kalbos vartotojai neturi šiuolaikinių galimybių greitai pasitikrinti, ar taisyklingai kirčiuoja konkrečius žodžius. Pranešime pristatoma tik viena mūsų kuriamos kompiuterinės programos dalis – veikiantis daiktavardžių ir būdvardžių kirčiavimo algoritmas ir svarbiausia jo sudedamoji dalis – formalizuota kirčiavimo taisyklių medžių struktūra. Aptariamos pagrindinės problemos, kurios iškilo įprastas lingvistines taisykles pritaikant kuriamuose algoritmuose. Nagrinėjama sąveika su morfologinės ir leksinės informacijos duomenų bazėmis. Pateikiami preliminarūs programos testavimo rezultatai ir jų gerinimo būdai. Analizuojamas galimybės, leisiančios patobulinti kai kurias programos dalis. Darbe pristatomas veikiantis daiktavardžių ir būdvardžių kirčiavimo algoritmas ir svarbiausia jo sudedamoji dalis – formalizuota medžio pavidalo kirčiavimo taisyklių struktūra. Pateikiami struktūrinio modelio sudarymo principai, pagrindžiamas jo tinkamumas kurti automatinio lietuvių kalbos kirčiavimo algoritmus. Aptariamos pagrindinės problemos, kurios iškilo įprastas lingvistines taisykles pritaikant kuriamuose algoritmuose. Nagrinėjama sąveika su morfologinės ir leksinės informacijos duomenų bazėmis. Pateikiamas preliminarus automatinio kirčiavimo tikslumo įvertinimas, gautas kirčiuojant daugiau nei 24 mln. daiktavardžių beveik 8 mln. būdvardžių, esančių VDU tekstyne, ir kirčiavimo tikslumo gerinimo būdai. Analizuojamos galimybės, leisiančios patobulinti kai kurias algoritmo dalis.Downloads
Published
2004-12-15
Issue
Section
COMPUTATIONAL LINGUISTICS
License

This work is licensed under a Creative Commons Attribution 4.0 International License.
The copyright for the articles in this journal is retained by the author(s) with the first publication right granted to the journal. The journal is licensed under the Creative Commons Attribution License 4.0 (CC BY 4.0).

