Отправьте статью сегодня! Журнал выйдет 12 июля, печатный экземпляр отправим 16 июля
Опубликовать статью

Молодой учёный

Проблемы машинного перевода

Вопросы переводоведения
06.07.2016
66
Поделиться
Библиографическое описание
Юнусова, М. О. Проблемы машинного перевода / М. О. Юнусова. — Текст : непосредственный // Филология и лингвистика. — 2016. — № 2 (4). — С. 52-55. — URL: https://moluch.ru/th/6/archive/33/1089/.

 

На сегодняшний день машинный перевод приобретает все большую популярность. Данный феномен связан, во-первых, с большим потоком информации, в том числе и на иностранном языке, и, во-вторых, с тем фактом, что автоматизированными системами перевода может воспользоваться любой человек вне зависимости от его уровня владения иностранным языком. К сожалению, несмотря на широкую известность таких систем и их частое использование, качество перевода оставляет желать лучшего.

Данная статья посвящена изучению данного вида перевода и рассматривает проблему использования автоматизированных систем перевода в разных функциональных стилях.

Несомненно, данная тема является достаточно актуальной в связи с потребностью продемонстрировать качество данного вида перевода и тем самым показать, что его использование не всегда может привести к положительному результату даже в том случае, когда такой перевод нужен лишь для общего понимания текста. Отсюда цель данной статьи — выявить основные проблемы и ошибки, возникающие в процессе машинного перевода.

В качестве материала для исследования были взяты отрывки из текстов основных функциональных стилей: художественного, разговорного, публицистического, официально-делового и научно-технического; и их перевод, сделанный с помощью одних из наиболее популярных автоматизированных систем перевода: Google Translator и PROMT online.

В качестве примера художественного стиля был взят отрывок из книги Э. Гилберт «Есть, молиться, любить». В связи с незнанием контекста перевод, выполненный машиной, не только безграмотен, но также значительно отличается от оригинала по смыслу. Во-первых, в отрывке речь идет о женщине, а не о мужчине, и машина, не способная проанализировать контекст, интерпретирует местоимение «я» по-своему. Во-вторых, вместо выплаты бракоразводной компенсации появляется «окупление» развода в переводе Google Translator и вместо выплаты гонорара адвокатам некие юридические законопроекты в переводе PROMT.

Что касается лексики, то, во-первых, не всегда подобран верный для данного контекст вариант (учитывая мой дом, учитывая мою квартиру given up my house, given up my apartment), во-вторых, при выборе варианта для модального глагола, также выбрано неверное для данного контекста значение (Я потерял бы все свои деньги — I would lose all my money, где would использовано в значении будущего в прошедшем). В-третьих, машинный переводчик не способен применять переводческие трансформации, если это необходимо, например, когда буквальный перевод фразы с английского будет некорректен для русского языка (достаточно [денег], чтобы купить мне год жизни enough of it [money] to buy me a year of life). В-четвертых, переводу, выполненному машиной, свойственен буквализм: машина переводит абсолютно все слова, включая те, что обычно при переводе на русский язык опускаются, например, глаголы-связки (Квартира, которую я нашел, является тихой студией). В-пятых, машинные переводчики не всегда распознают устойчивые выражения и омонимичные им свободные словосочетания (древние Римляне использовали в гонке колесницы их the ancient Romans used to race their chariots). И в-шестых, если слово отсутствует в словаре машинного переводчика, то оно остается в своем исходном виде на иностранном языке (Сады Borghese вместо сады Боргезе).

Что касается грамматики, то, хотя второй вариант все же более понятен, оба перевода в целом нельзя назвать связными текстами: во-первых, отсутствует согласование времен (Несколько недель спустя я живу в Италии), во-вторых, отсутствует согласование между словами (Все получилось, другими словами, как индонезийская знахарь предсказывали).

В-третьих, слова расставлены в хаотичном порядке или в порядке, представленном в оригинале. Но в связи с тем, что в русском языке порядок слов нефиксированный и положение слова в предложении влияет на общий смысл высказывания, порядок слов может и должен быть изменен, но машина не способна это сделать (где древние Римляне использовали в гонке колесницы их the ancient Romans used to race their chariots).

Что касается пунктуации, то она полностью перенесена из оригинала в перевод, но в связи с тем, что правила расстановки знаков препинания в наших языках разные, то в переводе знаки препинания расставлены невпопад (Через несколько недель, я живу в Италии).

Что касается общего оформления текста, то заметно, что те слова, которые в английском языке пишутся с заглавной буквы (например, личное местоимение I), в переводе также написаны с большой буквы.

Образцом устной речи был взят диалог из книги В. Сэллинджера «Над пропастью во ржи». Что касается оформления устной речи, то она оформляется по-разному в русском и английском языках, но машинные переводчики не учитывают данной особенности. Во-первых, в английском языке диалоги, как правило, оформляются в кавычках и новая цитата не выносится в следующую строку, в то время как в русском языке высказывание оформляется без кавычек и выделяется тире в начале, каждая новая фраза — с новой строки, что не было учтено в машинном варианте перевода. Во-вторых, знаки препинания прямой речи в английском языке остаются внутри кавычек («Hello, sir», I said.), в русском — запятая и тире выносятся за кавычки.

Если говорить о стиле разговорной речи, то сразу же бросается первая фраза обоих вариантов перевода: «Привет, сэр», сказал я». По какой-то причине обе автоматизированные системы перевода перевели достаточно формальное английское «hello» неформальным «привет», что в корне не соответствует данной ситуации общения подростка и уже пожилого человека, его учителя, что является очевидным даже в данном контексте (M'boy, old Spencer). Кроме того, в устной речи автор передает не только содержание речи, но и ее манеру, характерную для того или иного персонажа, например, в данном случае обращение «my boy» в устной речи персонажа редуцировалось до «mboy», что машина не была способна распознать как редуцированную форму и оставила именно в таком виде.

Что касается лексики, то наблюдаются те же самые ошибки, что и для художественного перевода: неверный для данного контекста вариант значения (Я получил Ваше примечание I got your note), неверное истолкование времени у глагольной формы (Я пришел, чтобы сказать до свидания в любом случае I'd have come over to say good-by anyway), неспособность распознать устойчивое словосочетание и найти ей эквивалент, соответственно применить лексическую трансформацию (он не попал в потолок he didn't hit the ceiling). Некоторые словосочетания переведены буквально («Имейте место там, мальчика» — «Have a seat there, boy»). Более того, некоторые неточно подобранные варианты для перевода привели к фактическим ошибкам (Я был в своем кабинете около двух часов I was in his office for around two hours).

Рассматривая переводы с точки зрения грамматики, необходимо отметить, что в переводе данного стиля слова в словосочетаниях довольно часто не согласуются (Как твоя грипп, сэр?).

Кроме того, если говорить отдельно о синтаксисе нужно заметить, что для устной речи характерны короткие предложения, которые в английском языке могут сводиться к сокращенным ответам на вопросы и различным репликам, которые вне контекста не имеют смысла (It is. I am. Yes, we did.) В связи с тем, что машинные переводчики переводят каждое предложение по отдельности, они не могут связать их в один связный текст. Нужно также заметить, что в данных переводах уже не наблюдается хаотичный порядок слов, как это было в художественном тексте, но скорее всего это связано с особенностью устной речи в использовании коротких фраз с прямым порядком слов.

В качестве образца публицистического стиля был взят отрывок из речи президента США Б. Обамы о стратегии борьбы с Исламским государством от 10.09.2014. Перевод данного стиля изобилуют теми же ошибками, что и переводы художественного и разговорного стилей: если говорить о лексике, также не всегда подобран верный вариант перевода (ISIL является террористической организацией, чистая и простая ISIL is a terrorist organization, pure and simple); присутствует ошибочный буквальный перевод (радикальные группы эксплуатируют обиды — своей собственной выгоды для radical groups exploit grievances for their own gain). Кроме того, для публицистического стиля характерны определенные речевые штампы, клише, лексика. Так для английского group в рамках данной темы подойдет больше вариант не «группа», а «группировка», поскольку речь идет о преступной террористической организации.

Что касается грамматики, то, во-первых, в переводе также содержится буквальный перевод, ошибочный не столько семантически, сколько грамматически, так как в оригинале существительное threats, употребленное во множественном числе, в переводе также осталось во множественном числе, хотя для данного контекста необходимо единственное (на данный момент наибольшие угрозы исходят с Ближнего Востока и Северной Африки At this moment the greatest threats come from the Middle East and North Africa). Во-вторых, существительное group (группа в переводе) стало мужского рода (И один из этих групп ISIL And one of those groups is ISIL).

В-третьих, некоторые слова в переводе опущены, что привело к нарушению конструкции предложения (И вот почему мы должны оставаться бдительными, как угроз And thats why we must remain vigilant as threats emerge). В некоторых случаях машинный переводчик не способен распознать, каким членом предложения является то или иное слово, в связи с чем рушится структура предложения и теряется смысл. Например, в предложении It is recognized by no government nor by the people it subjugates Google Translator, в отличии от PROMT, не сумел распознать субъекта действия, являющегося дополнением в страдательном предложении: Она признана не правительства, ни людей это подчиняет. В связи с данным обстоятельством — невозможностью определить члены предложения, конструкции предложения меняются, появляются новые знаки препинания, но смысл остается непереданным: (Мы не можем стереть каждый след зла от мировых и небольших групп убийц, имеют возможность причинить большой вред We cant erase every trace of evil from the world and small groups of killers have the capacity to do great harm).

Наблюдается также и хаотичный порядок слов (небольшие группы убийц есть потенциал, чтобы сделать большой вред small groups of killers have the capacity to do great harm).

Сохранение пунктуационных знаков оригинала также остается проблемой для данных переводов (Тем не менее, мы продолжаем сталкиваться с террористической угрозой / Однако, мы продолжаем сталкиваться с террористической угрозой Still, we continue to face a terrorist threat).

Данный стиль характеризуется строгим оформлением (в данном случае корреспонденции), отличающимся в русском и английском языках. Данные автоматизированные переводчики не способны изменить оформление оригинала, соответственно перевод выглядит точно так же. Во-первых, в русском языке, в отличие от английского, после начального обращения ставится либо запятая, после которой текст продолжается со строчной буквы в той же строке, либо восклицательный знак (вариант для деловой/официальной переписки). В данном случае следующий текст переносится в следующую строку с начала абзаца с большой буквы. Во-вторых, дата в документации на русском языке ставится в конце, а не в начале. В-третьих, названия журналов и иных периодических изданий в русском языке выделяются кавычками и только первое слово пишется с заглавной буквы.

Таким образом, можно заметить, что в переводе текстов любого стиля системы машинного перевода допускают примерно одинаковые ошибки, причем эти ошибки касаются практически всех сфер: оформления, лексики, грамматики, синтаксиса, пунктуации. Кроме того, встречаются стилевые и смысловые ошибки.

Лексические ошибки касаются в основном неверного выбора эквивалента, буквального перевода, невозможности выявления устойчивых выражений и нахождения их эквивалентов. Кроме того, для публицистического стиля характерен неверный перевод клише, для научного — неверный перевод атрибутивных групп.

Основные грамматические ошибки состоят в неверном согласовании времен и согласовании слов в словосочетаниях, а также хаотичном порядке слов.

Пунктуационные ошибки связаны с полным переносом знаков препинания оригинала в перевод, что в некоторых случаях мешает восприятию смысла предложения.

Выявлены многочисленные ошибки в оформлении: например, некоторые слова, пишущиеся со строчной буквы в русском языке, остались, как и в оригинале, с заглавной. В некоторых местах не поставлены кавычки. Оформление перевод текста официально-делового стиля оставлено в виде оригинала, хотя оформление документов на данных языках отличаются.

В-третьих, данные ошибки характерны для обеих автоматизированных систем перевода — Google Translator и PROMT, однако переводы PROMT чаще более связны и в них реже встречается буквальный перевод, но в них обычно всегда прямой порядок слов и если какое-либо слово отсутствует в словаре данного переводчика, то оно будет перенесено на языке оригинала, в отличие от Google Translator, который данные слова переводит путем транслитерации. Кроме того, некоторые короткие фразы, характерные для устного перевода и которые невозможно перевести без контекста, были удачно переведены Google Translator.

Если говорить в целом, то очевидно, что для создания качественного перевода не стоит использовать исключительно средства автоматизированных систем перевода, неспособных к переводу такого уровня в связи с отсутствием фоновых знаний, переводу по предложению, без принятия во внимание всего текста, отсутствия воображения и творческих способностей, необходимых переводчику и другими причинами, по которым машина не может заменить человека. Что касается ситуаций перевода не для аудитории, а лично для себя с целью ознакомиться с общим содержанием текста, то и в данном случае использование машинных переводчиков может быть неэффективно, так как в ходе машинного перевода допускаются и смысловые ошибки.

 

Литература:

 

  1.                Бархударов Л. С. Язык и перевод (Вопросы общей и частной теории перевода). М., «Междунар. отношения», 1975. — 240 с.
  2.                Майгурова И. «Пунктуация на тайной службе Ее Величества» — URL: http://www.bakanov.org/beginners/2/11
  3.                Титяева Г. В. «За» и «против» обучению машинному перевод в подготовке переводчиков // Титяева Г. В. / «Филологический журнал», 2010, № 17. — с. 61–64.
  4.                Фролов С. В., Панькова Д. А. Проблемы построения машинного перевода 2008. — 130 с.
  5.                Gilbert E. Eat, Pray, Love. London: Bloomsbury Publishing PLC. — 384 p.
  6.                Salinger J. D. The Catcher in the Rye. Moscow: KARO, 2009–288 p.
  7.                Transcript: President Obama’s speech outlining strategy to defeat Islamic State — URL: https://www.washingtonpost.com/politics/full-text-of-president-obamas-speech-outlining-strategy-to-defeat-islamic-state/2014/09/10/af69dec8–3943–11e4–9c9f-ebb47272e40e_story.html
Можно быстро и просто опубликовать свою научную статью в журнале «Молодой Ученый». Сразу предоставляем препринт и справку о публикации.
Опубликовать статью

Молодой учёный