На сегодняшний день машинный перевод приобретает все большую популярность. Данный феномен связан, во-первых, с большим потоком информации, в том числе и на иностранном языке, и, во-вторых, с тем фактом, что автоматизированными системами перевода может воспользоваться любой человек вне зависимости от его уровня владения иностранным языком. К сожалению, несмотря на широкую известность таких систем и их частое использование, качество перевода оставляет желать лучшего.
Данная статья посвящена изучению данного вида перевода и рассматривает проблему использования автоматизированных систем перевода в разных функциональных стилях.
Несомненно, данная тема является достаточно актуальной в связи с потребностью продемонстрировать качество данного вида перевода и тем самым показать, что его использование не всегда может привести к положительному результату даже в том случае, когда такой перевод нужен лишь для общего понимания текста. Отсюда цель данной статьи — выявить основные проблемы и ошибки, возникающие в процессе машинного перевода.
В качестве материала для исследования были взяты отрывки из текстов основных функциональных стилей: художественного, разговорного, публицистического, официально-делового и научно-технического; и их перевод, сделанный с помощью одних из наиболее популярных автоматизированных систем перевода: Google Translator и PROMT online.
В качестве примера художественного стиля был взят отрывок из книги Э. Гилберт «Есть, молиться, любить». В связи с незнанием контекста перевод, выполненный машиной, не только безграмотен, но также значительно отличается от оригинала по смыслу. Во-первых, в отрывке речь идет о женщине, а не о мужчине, и машина, не способная проанализировать контекст, интерпретирует местоимение «я» по-своему. Во-вторых, вместо выплаты бракоразводной компенсации появляется «окупление» развода в переводе Google Translator и вместо выплаты гонорара адвокатам некие юридические законопроекты в переводе PROMT.
Что касается лексики, то, во-первых, не всегда подобран верный для данного контекст вариант (учитывая мой дом, учитывая мою квартиру — given up my house, given up my apartment), во-вторых, при выборе варианта для модального глагола, также выбрано неверное для данного контекста значение (Я потерял бы все свои деньги — I would lose all my money, где would использовано в значении будущего в прошедшем). В-третьих, машинный переводчик не способен применять переводческие трансформации, если это необходимо, например, когда буквальный перевод фразы с английского будет некорректен для русского языка (достаточно [денег], чтобы купить мне год жизни — enough of it [money] to buy me a year of life). В-четвертых, переводу, выполненному машиной, свойственен буквализм: машина переводит абсолютно все слова, включая те, что обычно при переводе на русский язык опускаются, например, глаголы-связки (Квартира, которую я нашел, является тихой студией). В-пятых, машинные переводчики не всегда распознают устойчивые выражения и омонимичные им свободные словосочетания (древние Римляне использовали в гонке колесницы их — the ancient Romans used to race their chariots). И в-шестых, если слово отсутствует в словаре машинного переводчика, то оно остается в своем исходном виде на иностранном языке (Сады Borghese вместо сады Боргезе).
Что касается грамматики, то, хотя второй вариант все же более понятен, оба перевода в целом нельзя назвать связными текстами: во-первых, отсутствует согласование времен (Несколько недель спустя я живу в Италии), во-вторых, отсутствует согласование между словами (Все получилось, другими словами, как индонезийская знахарь предсказывали).
В-третьих, слова расставлены в хаотичном порядке или в порядке, представленном в оригинале. Но в связи с тем, что в русском языке порядок слов нефиксированный и положение слова в предложении влияет на общий смысл высказывания, порядок слов может и должен быть изменен, но машина не способна это сделать (где древние Римляне использовали в гонке колесницы их — the ancient Romans used to race their chariots).
Что касается пунктуации, то она полностью перенесена из оригинала в перевод, но в связи с тем, что правила расстановки знаков препинания в наших языках разные, то в переводе знаки препинания расставлены невпопад (Через несколько недель, я живу в Италии).
Что касается общего оформления текста, то заметно, что те слова, которые в английском языке пишутся с заглавной буквы (например, личное местоимение I), в переводе также написаны с большой буквы.
Образцом устной речи был взят диалог из книги В. Сэллинджера «Над пропастью во ржи». Что касается оформления устной речи, то она оформляется по-разному в русском и английском языках, но машинные переводчики не учитывают данной особенности. Во-первых, в английском языке диалоги, как правило, оформляются в кавычках и новая цитата не выносится в следующую строку, в то время как в русском языке высказывание оформляется без кавычек и выделяется тире в начале, каждая новая фраза — с новой строки, что не было учтено в машинном варианте перевода. Во-вторых, знаки препинания прямой речи в английском языке остаются внутри кавычек («Hello, sir», I said.), в русском — запятая и тире выносятся за кавычки.
Если говорить о стиле разговорной речи, то сразу же бросается первая фраза обоих вариантов перевода: «Привет, сэр», сказал я». По какой-то причине обе автоматизированные системы перевода перевели достаточно формальное английское «hello» неформальным «привет», что в корне не соответствует данной ситуации общения подростка и уже пожилого человека, его учителя, что является очевидным даже в данном контексте (M'boy, old Spencer). Кроме того, в устной речи автор передает не только содержание речи, но и ее манеру, характерную для того или иного персонажа, например, в данном случае обращение «my boy» в устной речи персонажа редуцировалось до «m’boy», что машина не была способна распознать как редуцированную форму и оставила именно в таком виде.
Что касается лексики, то наблюдаются те же самые ошибки, что и для художественного перевода: неверный для данного контекста вариант значения (Я получил Ваше примечание — I got your note), неверное истолкование времени у глагольной формы (Я пришел, чтобы сказать до свидания в любом случае — I'd have come over to say good-by anyway), неспособность распознать устойчивое словосочетание и найти ей эквивалент, соответственно применить лексическую трансформацию (он не попал в потолок — he didn't hit the ceiling). Некоторые словосочетания переведены буквально («Имейте место там, мальчика» — «Have a seat there, boy»). Более того, некоторые неточно подобранные варианты для перевода привели к фактическим ошибкам (Я был в своем кабинете около двух часов — I was in his office for around two hours).
Рассматривая переводы с точки зрения грамматики, необходимо отметить, что в переводе данного стиля слова в словосочетаниях довольно часто не согласуются (Как твоя грипп, сэр?).
Кроме того, если говорить отдельно о синтаксисе нужно заметить, что для устной речи характерны короткие предложения, которые в английском языке могут сводиться к сокращенным ответам на вопросы и различным репликам, которые вне контекста не имеют смысла (It is. I am. Yes, we did.) В связи с тем, что машинные переводчики переводят каждое предложение по отдельности, они не могут связать их в один связный текст. Нужно также заметить, что в данных переводах уже не наблюдается хаотичный порядок слов, как это было в художественном тексте, но скорее всего это связано с особенностью устной речи в использовании коротких фраз с прямым порядком слов.
В качестве образца публицистического стиля был взят отрывок из речи президента США Б. Обамы о стратегии борьбы с Исламским государством от 10.09.2014. Перевод данного стиля изобилуют теми же ошибками, что и переводы художественного и разговорного стилей: если говорить о лексике, также не всегда подобран верный вариант перевода (ISIL является террористической организацией, чистая и простая — ISIL is a terrorist organization, pure and simple); присутствует ошибочный буквальный перевод (радикальные группы эксплуатируют обиды — своей собственной выгоды для radical groups exploit grievances for their own gain). Кроме того, для публицистического стиля характерны определенные речевые штампы, клише, лексика. Так для английского group в рамках данной темы подойдет больше вариант не «группа», а «группировка», поскольку речь идет о преступной террористической организации.
Что касается грамматики, то, во-первых, в переводе также содержится буквальный перевод, ошибочный не столько семантически, сколько грамматически, так как в оригинале существительное threats, употребленное во множественном числе, в переводе также осталось во множественном числе, хотя для данного контекста необходимо единственное (на данный момент наибольшие угрозы исходят с Ближнего Востока и Северной Африки — At this moment the greatest threats come from the Middle East and North Africa). Во-вторых, существительное group (группа в переводе) стало мужского рода (И один из этих групп ISIL — And one of those groups is ISIL).
В-третьих, некоторые слова в переводе опущены, что привело к нарушению конструкции предложения (И вот почему мы должны оставаться бдительными, как угроз — And that’s why we must remain vigilant as threats emerge). В некоторых случаях машинный переводчик не способен распознать, каким членом предложения является то или иное слово, в связи с чем рушится структура предложения и теряется смысл. Например, в предложении It is recognized by no government nor by the people it subjugates Google Translator, в отличии от PROMT, не сумел распознать субъекта действия, являющегося дополнением в страдательном предложении: Она признана не правительства, ни людей это подчиняет. В связи с данным обстоятельством — невозможностью определить члены предложения, конструкции предложения меняются, появляются новые знаки препинания, но смысл остается непереданным: (Мы не можем стереть каждый след зла от мировых и небольших групп убийц, имеют возможность причинить большой вред — We can’t erase every trace of evil from the world and small groups of killers have the capacity to do great harm).
Наблюдается также и хаотичный порядок слов (небольшие группы убийц есть потенциал, чтобы сделать большой вред — small groups of killers have the capacity to do great harm).
Сохранение пунктуационных знаков оригинала также остается проблемой для данных переводов (Тем не менее, мы продолжаем сталкиваться с террористической угрозой / Однако, мы продолжаем сталкиваться с террористической угрозой — Still, we continue to face a terrorist threat).
Данный стиль характеризуется строгим оформлением (в данном случае корреспонденции), отличающимся в русском и английском языках. Данные автоматизированные переводчики не способны изменить оформление оригинала, соответственно перевод выглядит точно так же. Во-первых, в русском языке, в отличие от английского, после начального обращения ставится либо запятая, после которой текст продолжается со строчной буквы в той же строке, либо восклицательный знак (вариант для деловой/официальной переписки). В данном случае следующий текст переносится в следующую строку с начала абзаца с большой буквы. Во-вторых, дата в документации на русском языке ставится в конце, а не в начале. В-третьих, названия журналов и иных периодических изданий в русском языке выделяются кавычками и только первое слово пишется с заглавной буквы.
Таким образом, можно заметить, что в переводе текстов любого стиля системы машинного перевода допускают примерно одинаковые ошибки, причем эти ошибки касаются практически всех сфер: оформления, лексики, грамматики, синтаксиса, пунктуации. Кроме того, встречаются стилевые и смысловые ошибки.
Лексические ошибки касаются в основном неверного выбора эквивалента, буквального перевода, невозможности выявления устойчивых выражений и нахождения их эквивалентов. Кроме того, для публицистического стиля характерен неверный перевод клише, для научного — неверный перевод атрибутивных групп.
Основные грамматические ошибки состоят в неверном согласовании времен и согласовании слов в словосочетаниях, а также хаотичном порядке слов.
Пунктуационные ошибки связаны с полным переносом знаков препинания оригинала в перевод, что в некоторых случаях мешает восприятию смысла предложения.
Выявлены многочисленные ошибки в оформлении: например, некоторые слова, пишущиеся со строчной буквы в русском языке, остались, как и в оригинале, с заглавной. В некоторых местах не поставлены кавычки. Оформление перевод текста официально-делового стиля оставлено в виде оригинала, хотя оформление документов на данных языках отличаются.
В-третьих, данные ошибки характерны для обеих автоматизированных систем перевода — Google Translator и PROMT, однако переводы PROMT чаще более связны и в них реже встречается буквальный перевод, но в них обычно всегда прямой порядок слов и если какое-либо слово отсутствует в словаре данного переводчика, то оно будет перенесено на языке оригинала, в отличие от Google Translator, который данные слова переводит путем транслитерации. Кроме того, некоторые короткие фразы, характерные для устного перевода и которые невозможно перевести без контекста, были удачно переведены Google Translator.
Если говорить в целом, то очевидно, что для создания качественного перевода не стоит использовать исключительно средства автоматизированных систем перевода, неспособных к переводу такого уровня в связи с отсутствием фоновых знаний, переводу по предложению, без принятия во внимание всего текста, отсутствия воображения и творческих способностей, необходимых переводчику и другими причинами, по которым машина не может заменить человека. Что касается ситуаций перевода не для аудитории, а лично для себя с целью ознакомиться с общим содержанием текста, то и в данном случае использование машинных переводчиков может быть неэффективно, так как в ходе машинного перевода допускаются и смысловые ошибки.
Литература:
- Бархударов Л. С. Язык и перевод (Вопросы общей и частной теории перевода). М., «Междунар. отношения», 1975. — 240 с.
- Майгурова И. «Пунктуация на тайной службе Ее Величества» — URL: http://www.bakanov.org/beginners/2/11
- Титяева Г. В. «За» и «против» обучению машинному перевод в подготовке переводчиков // Титяева Г. В. / «Филологический журнал», 2010, № 17. — с. 61–64.
- Фролов С. В., Панькова Д. А. Проблемы построения машинного перевода 2008. — 130 с.
- Gilbert E. Eat, Pray, Love. London: Bloomsbury Publishing PLC. — 384 p.
- Salinger J. D. The Catcher in the Rye. Moscow: KARO, 2009–288 p.
- Transcript: President Obama’s speech outlining strategy to defeat Islamic State — URL: https://www.washingtonpost.com/politics/full-text-of-president-obamas-speech-outlining-strategy-to-defeat-islamic-state/2014/09/10/af69dec8–3943–11e4–9c9f-ebb47272e40e_story.html