Automatinis skiemenavimas: problemos ir jų sprendimas

Authors

  • Gailius Raškinis Vytauto Didţiojo universitetas
  • Asta Kazlauskienė Vytauto Didţiojo universitetas

Abstract

Natūraliai pasakytame žodyje tarp skiemenų nėra ryškių fonetinių ribų. Kalbai svarbesnis skiemenų skaičius, o ne tikslios ribos tarp jų. To užtenka ir kuriant skiemenavimo įrankį kalbos kompiuterinio apdorojimo reikmėms. Tačiau fundamentiniams skiemens struktūros tyrimams reikia tikslių skiemens ribų. Tam ir buvo kuriama automatinio skiemenavimo programa. Skiemens ribos čia nustatomos remiantis funkcine skiemens teorija: naujas skiemuo pradedamas maksimaliu priebalsių junginiu, kurio modelis galimas žodžio pradžioje. Tačiau ne visada šis modelis (pučiamasis, sprogstamasis arba afrikata, sklandusis priebalsis) gali būti be išlygų taikomas. Straipsnyje aprašomi probleminiai skiemenavimo atvejai ir jų sprendimas: dviejų balsių samplaikos interpretavimas (dvibalsis, hiatas ar papriešakėjęs balsis), priešdėlių nustatymo sunkumai, morfemų sandūra sudurtiniuose žodžiuose. Skiemenavimo programa klaidų nedaro. Jų gali atsirasti dėl labai retų homografų, vienodai rašomų, bet skirtingai tariamų ir skiemenuojamų žodžių. Tokius atvejus reikia atskirai rankiniu būdu peržiūrėti. Aprašytas skiemenavimo algoritmas naudojamas VDU sukurtose automatinio kirčiavimo ir transkribavimo programose bei fonotaktikos ir ritmikos tyrimuose.

Downloads

Published

2009-11-15

Issue

Section

COMPUTATIONAL LINGUISTICS