Машинный перевод

Машинный перевод – это автоматический перевод с одного естественного языка на другой с помощью компьютерных программ. Обычно его, вместе с компьютерным переводом, относят к категории электронного перевода. Компьютерный перевод стал объектом исследований в 1940-х годах, после появления электронно-вычислительных машин. Несмотря на успешное использование электронных переводчиков в определенных сферах человеческой деятельности, качественный машинный перевод текстов общего характера по-прежнему остается недостижимой целью.

Машинный перевод можно классифицировать по нескольким критериям: степень участия переводчика-человека; тип перевода – общий или специализированный; используемая системная архитектура.

При самостоятельном (полностью автоматизированном) машинном переводе устройство переводит тексты без какого-либо вмешательства операторов. Перевод с участием обычно делится на машинный перевод с участием человека и перевод человеком с помощью компьютера. Все более популярной формой перевода человеком с помощью компьютера становится автоматизированный перевод.

В зависимости от системной архитектуры, машинный перевод можно условно разделить на корпусный и основанный на правилах. А при разработке систем машинного перевода использовались два подхода: прямой и косвенный.

В системах машинного перевода, созданных до начала 1980-х годов, использовался преимущественно прямой подход. Такие системы работают с парами языков, используя статьи двуязычных словарей и морфологического анализа. Они переводят исходный текст слово в слово, без подробного анализа синтаксических структур вводимого текста и корреляции значений, после чего в тексте перевода делаются некоторые элементарные поправки в соответствии с морфологическими и синтаксическими правилами целевого языка. Это самый примитивный способ машинного перевода, однако в некоторых коммерческих системах он до сих пор используется.

В 1980-х годах косвенный подход, имеющий более сложную архитектуру, стал доминирующим методом машинного перевода. Устройства, в которых использован этот подход, анализируют синтаксическую структуру текста, обычно создавая абстрактное (промежуточное) представление о значении оригинала и создавая на его основе текст на целевом языке. В таких устройствах применяются программы, которые идентифицируют структуру слова (морфологию) и предложения (синтаксис) и решают проблемы омонимии (семантики).

При машинном переводе с использованием международного вспомогательного языка интерлингва процесс перевода состоит из двух основных стадий: сначала анализатор «трансформирует» исходный текст в интерлангва, а затем генератор «трансформирует» текст на интерлингва в текст на целевом языке. Наиболее очевидное преимущество такого метода заключается в том, что при переводах с использованием нескольких языковых пар нет необходимости создавать переходный компонент для каждой пары.

Слишком медленное повышение качества машинного перевода связано с проблемами, присущими языку как форме человеческом коммуникации. Грубо говоря, для перевода необходимы по крайней мере две категории знаний: 1) лингвистические, т.е. грамматические, семантические и прагматические знания; 2) экстралингвистические, включая знание темы и знания о реальном мире. Например, при ответе на вопрос о том, что больше – 35000х58000 или 1, любой человек, не задумываясь, скажет, что первое число больше: он сделает это благодаря своим знаниям о реальном мире. А вот компьютеру для ответа на такой, казалось бы, простой вопрос потребуется выполнение довольно сложных арифметических расчетов.

Кроме того, особые проблемы при компьютерном переводе создают присущая естественным языкам омонимия, а также лексические и структурные несоответствия между языками.

Услуги для Вас

Узнать больше