Skaitmenizuotų tekstų santraukų rengimo sistemos: panašumai, skirtumai ir taikymas lietuvių kalbai
DOI:
https://doi.org/10.5755/j01.sal..17.43379Keywords:
kompiuterinė lingvistika, automatinis santraukų rengimas, teksto glaudinimas, santraukos įskaitomumas, santraukos prasmingumasAbstract
Informacinei atskirčiai mažinti bei žmogaus laikui taupyti yra sukurti automatiniai santraukų ren-gimo instrumentai, kurių esmę sudaro specialiosios kompiuterinės santraukų komponavimo programos. Auto-matinis teksto santraukos rengimas yra vienas iš svarbių kompiuterinės lingvistikos tyrimo objektų, siekiant gauti prasmingesnį ir kokybiškesnį rezultatą. Apie šias technologijas Lietuvoje kol kas turime mažai informa-cijos, nors užsienyje kompiuterinės lingvistikos specialistai jas kuria ir nuolat tobulina. Šiuo metu didelė dalis santraukų automatinio rengimo sistemų (SARS) neapsiriboja vien skaitmeniniu tekstu, bet siekia apimti įvai-rialypę informaciją, cirkuliuojančią pasauliniame interneto tinkle – tekstą, vaizdinę ir garsinę medžiagą, pa-veikslėlius ir pan. Tyrimui buvo atrinktos automatinės teksto santraukų rengimo sistemos ir technologijos, ku-rios yra daugiau artimos ir reikšmingos kompiuterinės lingvistikos sričiai. Nustatyta jų praktinė nauda ir gali-mybės jas taikyti lietuvių kalbos tekstams. Atrinkę ir susipažinę su keliomis populiariausiomis SARS technolo-gijomis (angl. summarizers), atskleisime skaitmeninio teksto santraukų rengimo skirtumus, atsirandančius ku-riant santraukas įvairių kalbų ar žanrų tekstams su skirtingo tipo sistemomis.
Downloads
Published
Issue
Section
License
Copyright (c) 2010 Studies about Languages

This work is licensed under a Creative Commons Attribution 4.0 International License.
The copyright for the articles in this journal is retained by the author(s) with the first publication right granted to the journal. The journal is licensed under the Creative Commons Attribution License 4.0 (CC BY 4.0).

