Sintaksinio sudėtingumo analizė anotuotame lietuvių kalbos tekstyne priklausomybių nuotolio metodu

Authors

  • Vytautas Ožeraitis Vytautas Magnus University, Lithuania

DOI:

https://doi.org/10.5755/j01.sal.1.39.29258

Keywords:

Sintaksinis sudėtingumas, tekstynų lingvistika, sintaksinės priklausomybės nuotolis, lietuvių kalba, tekstynų anotavimas

Abstract

Sintaksinis sudėtingumas yra visoms kalboms būdinga ypatybė, labai bendrai apibūdinama kaip sakinio (ar teksto) ir jo elementų įmantrumą, detalumą, sąrangą bei jungimosi modelius sudėtingumo aspektu pateikiantis įvertis. Lietuvių kalboje sintaksinis sudėtingumas nėra plačiai analizuotas. Sintaksinio sudėtingumo tyrimus apsunkina nenusistovėjusi termino apibrėžtis ir skirtingų jo apskaičiavimo metodų gausa. Šiame straipsnyje pristatomas sintaksinio sudėtingumo tyrimas sintaksiškai anotuotame lietuvių kalbos tekstyne ALKSNIS, naudojant sintaksinės priklausomybės nuotolio metodą, paremtą Dependency Locality teorija. Straipsnyje aprašoma sintaksinio sudėtingumo samprata, pristatomi sintaksinio sudėtingumo tyrimų principai, jų aktualumas ir pritaikomumas, pristatomi ir aptariami sintaksinio sudėtingumo rezultatai tekstyne, analizuojami pasirinkto metodo privalumai ir trūkumai. Šiuo tyrimu siekiama papildyti lietuvių kalbos sintaksinio sudėtingumo analizės lauką.

Sintaksinio sudėtingumo analizei naudojami du rodmenys – vidutinis priklausomybės nuotolis ir modifikuotas vidutinis priklausomybės nuotolis, sintaksiškai anotuotame tekstyne apskaičiuojant sintaksinių sakinio priklausomybės ryšių distanciją. Tyrime analizuojami visi tekstyno sakiniai, nustatomas atskirų tekstų ir tekstyno dalių sintaksinis sudėtingumas. Detaliau analizuojant paskirus sakinius, išryškėja tiek šių metodų trūkumai sintaksinio sudėtingumo analizei, tiek jų priklausomybė nuo tikslios ir nuoseklios anotavimo schemos. Analizuojant duomenis išryškėja poreikis į sintaksinio sudėtingumo sampratą bei formulę įtraukti sakinių tarpusavio sąsajų svertus. Nustatyta, kad modifikuoto vidutinio priklausomybės nuotolio formulėje įtraukta sakinio viršūnės pozicija galimai iškreipia rezultatus, todėl šią formulę reikėtų toliau tikslinti. Tyrimo metu nustatytos sakinių ir tekstų sudėtingumo ribos laikomos tik orientacinėmis, tiksliau joms apibrėžti siūlomi papildomi kokybiniai tyrimai ir eksperimentai.

Downloads

Published

2021-11-27

Issue

Section

LINGUISTICS