Dažniausios lietuvikalbos morfologinio daugiareikšmiškumo ršys ir jautomatinis vienareikšminimas
DOI:
https://doi.org/10.5755/j01.sal.1.5.43184Abstract
Straipsnyje pristatomas mažai tyrinėtas lietuvių kalbos morfologinis daugiareikšmiškumas ir pirmieji automatinio vienareikšminimo bandymai. Rašoma apie automatiniu būdu sulemuotą ir morfologiškai anotuotą lietuvių kalbos tekstyną. Ištyrus anotuotą tekstyną, paaiškėjo, kad kalba yra labai daugiareikšmė – apie 50 proc. žodžių ar žodžių formų yra morfologiškai daugiareikšmės. Norint panaudoti morfologiškai anotuoto tekstyno duomenis tolesniems tyrimams (automatinei sintaksinei analizei, kelių kalbų lygiagrečiam nagrinėjimui, automatiniam vertimui) reikia turėti vienareikšmes formas. Kitoms kalboms yra sukurta nemažai specialių vienareikšminimo programų. Lietuvoje ši sritis yra visai nauja ir mažai tirta, todėl tik visai neseniai buvo pradėta išsamiau gilintis į morfologinį daugiareikšmiškumą ir jo ribojimo galimybes. Šis straipsnis – tai lingvistų ir informatikų bendradarbiavimo, ribojant morfologinį daugiareikšmiškumą, rezultatų aptarimas.Downloads
Published
2004-06-15
Issue
Section
COMPUTATIONAL LINGUISTICS
License
Copyright (c) 2004 Studies about Languages

This work is licensed under a Creative Commons Attribution 4.0 International License.
The copyright for the articles in this journal is retained by the author(s) with the first publication right granted to the journal. The journal is licensed under the Creative Commons Attribution License 4.0 (CC BY 4.0).

