Dažniausios lietuvikalbos morfologinio daugiareikšmiškumo ršys ir jautomatinis vienareikšminimas

Authors

  • Erika Rimkutė Vytauto Didžiojo universiteto Kompiuterinės lingvistikos centras
  • Aušra Grybinaitė Vytauto Didžiojo universitetas

DOI:

https://doi.org/10.5755/j01.sal.1.5.43184

Abstract

Straipsnyje pristatomas mažai tyrinėtas lietuvių kalbos morfologinis daugiareikšmiškumas ir pirmieji automatinio vienareikšminimo bandymai. Rašoma apie automatiniu būdu sulemuotą ir morfologiškai anotuotą lietuvių kalbos tekstyną. Ištyrus anotuotą tekstyną, paaiškėjo, kad kalba yra labai daugiareikšmė – apie 50 proc. žodžių ar žodžių formų yra morfologiškai daugiareikšmės. Norint panaudoti morfologiškai anotuoto tekstyno duomenis tolesniems tyrimams (automatinei sintaksinei analizei, kelių kalbų lygiagrečiam nagrinėjimui, automatiniam vertimui) reikia turėti vienareikšmes formas. Kitoms kalboms yra sukurta nemažai specialių vienareikšminimo programų. Lietuvoje ši sritis yra visai nauja ir mažai tirta, todėl tik visai neseniai buvo pradėta išsamiau gilintis į morfologinį daugiareikšmiškumą ir jo ribojimo galimybes. Šis straipsnis – tai lingvistų ir informatikų bendradarbiavimo, ribojant morfologinį daugiareikšmiškumą, rezultatų aptarimas.

Downloads

Published

2004-06-15

Issue

Section

COMPUTATIONAL LINGUISTICS