Automatinis skiemenavimas: problemos ir jų sprendimas
Abstract
Natūraliai pasakytame žodyje tarp skiemenų nėra ryškių fonetinių ribų. Kalbai svarbesnis skiemenų skaičius, o ne tikslios ribos tarp jų. To užtenka ir kuriant skiemenavimo įrankį kalbos kompiuterinio apdorojimo reikmėms. Tačiau fundamentiniams skiemens struktūros tyrimams reikia tikslių skiemens ribų. Tam ir buvo kuriama automatinio skiemenavimo programa. Skiemens ribos čia nustatomos remiantis funkcine skiemens teorija: naujas skiemuo pradedamas maksimaliu priebalsių junginiu, kurio modelis galimas žodžio pradžioje. Tačiau ne visada šis modelis (pučiamasis, sprogstamasis arba afrikata, sklandusis priebalsis) gali būti be išlygų taikomas. Straipsnyje aprašomi probleminiai skiemenavimo atvejai ir jų sprendimas: dviejų balsių samplaikos interpretavimas (dvibalsis, hiatas ar papriešakėjęs balsis), priešdėlių nustatymo sunkumai, morfemų sandūra sudurtiniuose žodžiuose. Skiemenavimo programa klaidų nedaro. Jų gali atsirasti dėl labai retų homografų, vienodai rašomų, bet skirtingai tariamų ir skiemenuojamų žodžių. Tokius atvejus reikia atskirai rankiniu būdu peržiūrėti. Aprašytas skiemenavimo algoritmas naudojamas VDU sukurtose automatinio kirčiavimo ir transkribavimo programose bei fonotaktikos ir ritmikos tyrimuose.Downloads
Published
2009-11-15
Issue
Section
COMPUTATIONAL LINGUISTICS
License

This work is licensed under a Creative Commons Attribution 4.0 International License.
The copyright for the articles in this journal is retained by the author(s) with the first publication right granted to the journal. The journal is licensed under the Creative Commons Attribution License 4.0 (CC BY 4.0).

