Skaitmenizuotų tekstų santraukų rengimo sistemos: panašumai, skirtumai ir taikymas lietuvių kalbai

Authors

  • Jurgita Lasytė Kauno technologijos universitetas
  • Bronius Tamulynas Kauno technologijos universitetas

DOI:

https://doi.org/10.5755/j01.sal..17.43379

Keywords:

kompiuterinė lingvistika, automatinis santraukų rengimas, teksto glaudinimas, santraukos įskaitomumas, santraukos prasmingumas

Abstract

Informacinei atskirčiai mažinti bei žmogaus laikui taupyti yra sukurti automatiniai santraukų ren-gimo instrumentai, kurių esmę sudaro specialiosios kompiuterinės santraukų komponavimo programos. Auto-matinis teksto santraukos rengimas yra vienas iš svarbių kompiuterinės lingvistikos tyrimo objektų, siekiant gauti prasmingesnį ir kokybiškesnį rezultatą. Apie šias technologijas Lietuvoje kol kas turime mažai informa-cijos, nors užsienyje kompiuterinės lingvistikos specialistai jas kuria ir nuolat tobulina. Šiuo metu didelė dalis santraukų automatinio rengimo sistemų (SARS) neapsiriboja vien skaitmeniniu tekstu, bet siekia apimti įvai-rialypę informaciją, cirkuliuojančią pasauliniame interneto tinkle – tekstą, vaizdinę ir garsinę medžiagą, pa-veikslėlius ir pan. Tyrimui buvo atrinktos automatinės teksto santraukų rengimo sistemos ir technologijos, ku-rios yra daugiau artimos ir reikšmingos kompiuterinės lingvistikos sričiai. Nustatyta jų praktinė nauda ir gali-mybės jas taikyti lietuvių kalbos tekstams. Atrinkę ir susipažinę su keliomis populiariausiomis SARS technolo-gijomis (angl. summarizers), atskleisime skaitmeninio teksto santraukų rengimo skirtumus, atsirandančius ku-riant santraukas įvairių kalbų ar žanrų tekstams su skirtingo tipo sistemomis.

Downloads

Published

2010-11-15

Issue

Section

COMPUTATIONAL LINGUISTICS