Palyginamojo tekstyno kūrimo principai, problemos ir panaudojimo galimybės
Abstract
Tekstynas (angl. Corpus) – programiškai apdorotas elektroninių tekstų rinkinys, skirtas atspindėti realią kalbos vartoseną. Dėl savo apimties, prieinamumo, lingvistinių ir enciklopedinių žinių ir kitų ypatybių pasaulinėje kalbotyroje pastaraisiais dešimtmečiais tekstynų sudarymas laikomas vos ne pagrindiniu, o svarbiausia, labai patikimu kalbos tyrimo metodu ir priemone. Tekstynų lingvistika tapo vienos iš perspektyviausių šiuo metu kalbotyros šakos – kompiuterinės lingvistikos – sudedamąja dalimi. Kauno technologijos universitete (KTU) pradėtas rinkti naujo lietuvių kalbotyroje tipo lyginamasis tekstynas. Tai dvikalbis lietuvių ir anglų kalbų tekstynas, atspindintis vieno funkcinio stiliaus – šiuolaikinės mokslo kalbos ypatybes. Jo tekstų tematika labai konkreti ir apibrėžta – tai technologijos (chemijos, transporto, elektros, informatikos ir kt.) mokslų kalba. Straipsnyje pateikiamas kuriamo tekstyno modelis, aptariamos pagrindinės problemos, akcentuojami medžiagos paieškos ir atrankos kriterijai, svarstomas tekstyno pragmatiškumo klausimas, bandoma nuspėti palyginamojo tekstyno pritaikymo galimybes (terminologijoje, leksikografijoje, vertimuose ir kt.).Downloads
Published
2002-11-15
Issue
Section
COMPUTATIONAL LINGUISTICS
License

This work is licensed under a Creative Commons Attribution 4.0 International License.
The copyright for the articles in this journal is retained by the author(s) with the first publication right granted to the journal. The journal is licensed under the Creative Commons Attribution License 4.0 (CC BY 4.0).

