Artimkalbmašininis vertimas

Authors

  • Erika Rimkutė
  • Petr Homola

Abstract

Mašininis vertimas yra viena iš didžiausių kompiuterinės lingvistikos užduočių. Vertimo rezultatai tuo geresni, kuo siauresnė vertimo duomenų tema. Kitas svarbus kriterijus yra abiejų kalbų artimumas. Kaip paaiškėjo ankstesniuose projektuose, vertimui tarp artimų kalbų (pvz., tarp slavų) nereikia pilnos lingvistinės analizės – užtenka, pavyzdžiui, tik daiktavardžių ir panašių grupių analizės. Tai patvirtino Prahos Karlo universiteto Formaliosios ir taikomosios lingvistikos institute sukurta vertimo tarp slavų kalbų sistema Česílko, kuri jau pritaikyta ir kito tipo kalboms. Straipsnyje pristatysime eksperimentinį šios sistemos modelį, pritaikytą lietuvių kalbai. Aprašysime vartojamas paprastąsias gramatikas, analizuojančias daiktavardžių ir prielinksnių grupes, čekų ir lietuvių kalbų panašumus bei skirtumus, dvikalbį žodyną, pagal kurį verčiamos visos pagrindinės formos ir linksniuojami arba asmenuojami kaitomi žodžiai. Be to, paaiškinsime, kaip įvertinamas vertimo rezultatas.

Downloads

Published

2004-12-15

Issue

Section

COMPUTATIONAL LINGUISTICS