Palyginamojo tekstyno kūrimo principai, problemos ir panaudojimo galimybės

Authors

  • Jurgita Mikelionienė Kauno technologijos universitetas

Abstract

Tekstynas (angl. Corpus) – programiškai apdorotas elektroninių tekstų rinkinys, skirtas atspindėti realią kalbos vartoseną. Dėl savo apimties, prieinamumo, lingvistinių ir enciklopedinių žinių ir kitų ypatybių pasaulinėje kalbotyroje pastaraisiais dešimtmečiais tekstynų sudarymas laikomas vos ne pagrindiniu, o svarbiausia, labai patikimu kalbos tyrimo metodu ir priemone. Tekstynų lingvistika tapo vienos iš perspektyviausių šiuo metu kalbotyros šakos – kompiuterinės lingvistikos – sudedamąja dalimi. Kauno technologijos universitete (KTU) pradėtas rinkti naujo lietuvių kalbotyroje tipo lyginamasis tekstynas. Tai dvikalbis lietuvių ir anglų kalbų tekstynas, atspindintis vieno funkcinio stiliaus – šiuolaikinės mokslo kalbos ypatybes. Jo tekstų tematika labai konkreti ir apibrėžta – tai technologijos (chemijos, transporto, elektros, informatikos ir kt.) mokslų kalba. Straipsnyje pateikiamas kuriamo tekstyno modelis, aptariamos pagrindinės problemos, akcentuojami medžiagos paieškos ir atrankos kriterijai, svarstomas tekstyno pragmatiškumo klausimas, bandoma nuspėti palyginamojo tekstyno pritaikymo galimybes (terminologijoje, leksikografijoje, vertimuose ir kt.).

Downloads

Published

2002-11-15

Issue

Section

COMPUTATIONAL LINGUISTICS