Особенности перевода терминологии в сфере искусственного интеллекта | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 27 июля, печатный экземпляр отправим 31 июля.

Опубликовать статью в журнале

Автор:

Научный руководитель:

Рубрика: Филология, лингвистика

Опубликовано в Молодой учёный №20 (519) май 2024 г.

Дата публикации: 18.05.2024

Статья просмотрена: 69 раз

Библиографическое описание:

Бражникова, Д. Ю. Особенности перевода терминологии в сфере искусственного интеллекта / Д. Ю. Бражникова. — Текст : непосредственный // Молодой ученый. — 2024. — № 20 (519). — С. 547-550. — URL: https://moluch.ru/archive/519/114300/ (дата обращения: 17.07.2024).



Данная статья освещает особенности перевода терминологии в сфере искусственного интеллекта (ИИ), обусловленные её узкоспециализированным и динамичным характером. Автор обсуждает разнообразные переводческие трансформации, используемые для передачи терминов ИИ на русский язык, выделяя значимость контекста и последовательности в переводе. Анализ этих аспектов помогает устранить проблемы, возникающие при переводе текстов в сфере ИИ.

Ключевые слова: искусственный интеллект, термин, терминосистема, переводческие трансформации, заимствование, эквивалент.

Искусственный интеллект (ИИ) стал одним из ведущих направлений научно-технического прогресса в XXI веке. В связи с этим повышается интерес к переводу материалов по данной теме. Как правило, научно-технические и производственные документы в значительной степени полагаются на термины, которые представляют собой ключевые слова с высокой информативной ценностью. Перевод специальной лексики представляет для специалистов сложную задачу, требующую сочетания в рамках одного текста терминов из разнообразных областей. Рассмотрим наиболее востребованные направления перевода в сфере ИИ:

– Наука: как отмечают исследователи, «количество ежегодных научных публикаций по теме ИИ стабильно растет на 5,6 %» [7, с. 38]. В этом направлении занимаются переводом технической документации, научных статей и патентов, связанных с исследованиями и разработками в области ИИ. Это способствует ускорению обмена знаниями и сотрудничества между специалистами в сфере ИИ из разных стран.

– Технологии: к этому пункту относится перевод интерфейсов, документации и обучающих материалов для программного обеспечения и технологий, использующих ИИ, что помогает обеспечить доступность материалов по ИИ для разработчиков и специалистов по данным, не владеющих английским языком, а также предоставить иностранным компаниям возможности для внедрения ИИ-технологий, адаптированных к их местному рынку.

– Образование: осуществляется перевод образовательных материалов, таких как учебники, лекции, курсы и брошюры, посвященных как самому искусственному интеллекту, так и возможностям применения технологий ИИ в сфере науки и образования. В первом случае благодаря переводу расширяется доступ к знаниям для разноязычной аудитории, а во втором модернизируется программа обучения и повышается вовлеченность обучающихся.

Актуальность данного исследования состоит в растущем интересе к материалам, посвященным теме ИИ, что обусловлено стремительным развитием технологий и применением ИИ во многих сферах деятельности. Соответственно, наблюдается и увеличение разнообразия терминологии, что создает необходимость в эффективных методах ее перевода для улучшения понимания и распространения знаний в этой области.

Цель настоящего исследования состоит в исследовании и анализе возможных методов и приемов передачи терминов в сфере искусственного интеллекта на русский язык. Статья направлена на выявление оптимальных методов, способствующих сохранению смысла и точности терминологии на языке перевода. Для достижения поставленной цели будет использован систематический подход, включающий в себя анализ различных глоссариев, словарей и терминологических баз данных, специфичных для области искусственного интеллекта.

В. М. Лейчик в работе «Терминоведение: Предмет, методы, структура» приводит такое определение понятия «термин»: это «лексическая единица определенного языка для специальных целей, обозначающая общее — конкретное или абстрактное — понятие теории определенной специальной области знаний или деятельности» [4, с. 31–32]. Термины не существуют изолированно в языке, а всегда являются частью терминологии или «терминологического поля» [6, с. 62]. Терминологические системы являются динамичными, поскольку они постоянно адаптируются, чтобы отражать изменения в соответствующей области знаний: устаревшие термины уступают место более удачным, регулярно появляются неологизмы. Эта постоянная эволюция терминологии, характерная для многих областей научного и технического знания, имеет особенное значение в контексте искусственного интеллекта.

Термин «искусственный интеллект» был введен в научный оборот Джоном Маккарти на семинаре в Дартмутском колледже в 1956 году. Искусственный интеллект — это «раздел информатики, посвященный моделированию интеллектуальной деятельности» и выполнению творческих задач, характерных для человека [8, с. 3]. Некоторые термины сферы ИИ также являются частью терминосистемы сферы информационных технологий, так как они описывают основные концепции и технологии, лежащие в основе обеих областей. Развитие смежных дисциплин, таких как биоинформатика, компьютерная лингвистика и нейронные сети, оказало дополнительное влияние на область ИИ. Соответственно, сфера искусственного интеллекта характеризуется постоянным появлением новых терминов (неологизмов) и уточнением уже существующих. Таким образом, структура терминологии в области искусственного интеллекта остается в центре внимания ученых и специалистов, поскольку она отражает не только саму суть технологии, но и ее эволюцию и взаимосвязи с другими областями знаний.

Любые слова из языка могут стать терминами, если они используются в узкой специальной области для обозначения конкретных понятий. В процессе перевода терминологии переводчик выбирает один из двух основных подходов: перевод прямой или буквальный и перевод косвенный (непрямой). При переводе сообщения с исходного языка на язык перевода может возникнуть несколько ситуаций. В идеальном случае сообщение можно перевести дословно, поскольку оно основано на схожих категориях (структурный параллелизм) или концепциях (металингвистический параллелизм) [3, с. 72]. Однако иногда в языке перевода обнаруживается пробел, который необходимо заполнить эквивалентными средствами, сохранив общее впечатление от сообщения. Структурные или металингвистические различия могут также препятствовать точному переводу. В таких ситуациях переводчик может прибегать к более сложным приемам, которые могут показаться необычными, но необходимы для достижения эквивалентности. Это способы косвенного (непрямого) перевода. Заимствование, калькирование и дословный перевод — способы прямого перевода, остальные — косвенного.

Рассмотрим переводческие трансформации, с помощью которых возможно в полной мере передать терминологическую единицу, а также некоторые другие способы передачи терминов в области ИИ.

  1. Калькирование. Под калькированием понимают «способ перевода лексической единицы оригинала путем замены ее составных частей — морфем или слов их лексическими соответствиями в ПЯ» [3, с. 173]. В результате создаётся термин на языке перевода, который копирует структуру исходной лексической единицы и может считаться однозначным эквивалентом определённого термина, например: adaptive system — адаптивная система, deep neural network — глубокая нейронная сеть, intelligent system — интеллектуальная система, training data — обучающие данные. При калькировании термина либо переводится структура слова, либо воссоздается тип словосочетания: machine translation — машинный перевод, image processing — обработка изображений. В некоторых случаях калькирование сопровождается процессами свертывания или развертывания исходного термина, что может включать в себя добавление дополнительных элементов или сокращение исходных элементов: например, термин «central processing unit» может быть переведен как «центральный процессор», где составная часть «processing unit» объединяется в одно слово, при этом полностью сохраняя смысл лексической единицы исходного языка.
  2. Заимствование без перевода, то есть передача термина латиницей. Этот подход активно применяется в литературе и профессиональном дискурсе об ИИ. Например, термины-аббревиатуры «AI» (Artificial Intelligence), «ML» (Machine Learning), «DL» (Deep Learning) хоть и имеют признанные эквиваленты на русском языке, в некоторых случаях остаются в оригинале. Причины такого заимствования могут быть разнообразными, но чаще всего имеют место экстралингвистические факторы. Во-первых, это позволяет сохранить единообразие и точность терминологии в мировом контексте, упрощая коммуникацию между специалистами из разных стран. Во-вторых, некоторые термины имеют широкую распространенность и узнаваемость именно в оригинальной форме. Например, термин «deepfake» на русский язык переводился различными способами, включая калькирование («глубокая подделка») и транскрипцию («дипфейк»). Однако в последнее время в СМИ всё чаще это понятие приводится на английском языке.
  3. Транскрипция и транслитерация. Транслитерация воспроизводит буквенный состав слова на языке перевода, в то время как транскрипция передает звуковой состав слова с использованием звукового сходства. При переводе терминов часто используется комбинация транскрипции и транслитерации. Изначально слова, переведённые таким способом, были понятны только специалистам данной области, но со временем превратились в устойчивые общепринятые выражения, например interface — интерфейс, driver — драйвер. В связи с быстрым развитием данной области появляются новые концепции, которые также передаются на русский язык при помощи транскрипции и транслитерации, но понимание этих терминов может быть затруднено без наличия у реципиентов соответствующих знаний в предметной области: benchmarking — бенчмаркинг (сопоставительный анализ отдельных показателей), labeler — лабелер (контролируемое обучение, обучение с учителем), token — токен (категория цифровых активов, специально разработанных для облегчения развития и поддержки проектов, приложений и услуг на основе ИИ).
  4. Семантический эквивалент. Под семантической эквивалентностью понимают замену понятия с ИЯ на ПЯ в данном контексте при сохранении относительного смыслового тождества высказываний. В ходе данного приёма переводчик находит в русском языке корень, аналогичный по смыслу английскому термину: network — сеть, root — корневая директория, network infrastructure — сетевая инфраструктура, installation — установка, body — тело, внутренняя часть информационного объекта. Этот метод перевода наиболее адекватен с академической точки зрения, однако будет затруднительно подобрать полный эквивалент из-за специфики языков и технических особенностей терминов.
  5. Экспликация. Экспликация или описательный перевод — это прием, при котором слово на исходном языке заменяется более подробным описанием или словосочетанием, передающим его значение в языке перевода. Этот подход применяется в тех случаях, когда краткого определения термина недостаточно и нет точного эквивалента в языке перевода. Например, «voice over IP» можно перевести как «передача голоса с использованием IP-протокола», «data mining» как «поиск закономерностей в базах данных» или же «интеллектуальный анализ данных». Хотя описательный перевод часто приводит к увеличению объема текста на языке перевода, он эффективно передает значение многих типов безэквивалентных лексических единиц: inductive bias — индуктивная предвзятость алгоритма обучения. Нередко переводчики комбинируют экспликацию с другими приемами, такими как транскрипция или калькирование, чтобы емко выразить определенное понятие, при этом сохранив семантику единицы при переводе. Подобная стратегия дает возможность использовать более компактные формы перевода в последующих случаях употребления термина в тексте, так как, разъяснив однажды значение данной единицы, переводчик в дальнейшем может использовать транскрипцию или кальку, смысл которой будет уже понятен читателю.
  6. Создание нового термина на русском языке. В связи с появлением новых технологических разработок в сфере ИИ, при переводе терминологии может возникнуть необходимость создания нового термина, особенно если в оригинале нет точного эквивалента или существующие термины не передают суть концепции полностью. Термин-неологизм должен быть лаконичным, ясным и соответствовать основным принципам русского языка: entity-relationship — модель сущность-связь. В некоторых случаях для создания нового термина в языке перевода используют и комбинируют приемы калькирования, транслитерации и транскрипции, экспликации, а также модуляции: actuator — исполнительный механизм, актуатор, hashing — хэширование, arity — размерность набора данных, abandonware — не поддерживаемое (разработчиком) программное обеспечение. В сфере ИИ узконаправленный термин «fork» в речи и личной переписке специалистов может употребляться как «форк», то есть транслитерироваться, однако в научно-технических и производственных документах создали новый термин, который отразил семантику понятия: «ветвление» (например, алгоритма).

При переводе терминов в сфере искусственного интеллекта, специалисту необходимо следовать определенному порядку действий, чтобы обеспечить точность и адекватность перевода. В первую очередь необходимо внимательно проанализировать контекст, в котором используется терминология, так как, возможно, слово употребляется не в своём прямом значении и требует не поиска прямого эквивалента, а комплексной трансформации. Во-вторых, поскольку терминология данной сферы постоянно развивается, важно ознакомиться с существующими вариантами перевода терминов в различных словарях и глоссариях. При этом важно учитывать существующие стандарты, регулирующие использование терминологии в данной области с целью обеспечить единообразие и понятность в использовании терминологии. В случае сомнений или случаев неоднозначности при переводе терминов, будет полезно обратиться за помощью к экспертам в области искусственного интеллекта или лингвистам, специализирующимся на данной тематике, чтобы выбрать наиболее точный и соответствующий контексту перевод.

В ходе проведенного анализа было выявлено, что для интерпретации иноязычных терминов в сфере искусственного интеллекта используются различные приемы перевода: транскрипция и транслитерация, семантический эквивалент, заимствование без перевода и калькирование, также применим метод создания нового термина на русском языке. Однако переводчики активно работают над усовершенствованием алгоритмов, так называемых «моделей перевода», для стандартизации и упрощения этого процесса. Применение разнообразных методов перевода способствует точной передаче специализированных терминов искусственного интеллекта на русский язык, что способствует более эффективному развитию и внедрению ИИ-технологий в России.

Литература:

  1. Аверкин А. Н. Толковый словарь по искусственному интеллекту А. Н. Аверкин, М. Г. Гаазе-Рапопорт, Д. А. Поспелов — М.: Радио и связь,1992.
  2. Искусственный интеллект: электронный терминологический словарь составители Е. М. Зайцева, Е. А. Погодина, Ю. В. Смирнов. — Москва: ГПНТБ России, 2023.
  3. Комиссаров В. Н. Теория перевода (лингвистические аспекты): Учеб. для ин-тов и фак. иностр. яз. — М.: Высш. шк., 1990.
  4. Лейчик В. М. Терминоведение. Предмет, методы, структура. М.: Книжный дом «ЛИБРИКОМ», 2014.
  5. Пройдаков Э. М., Теплицкий Л. А. Англо-русский толковый словарь по искусственному интеллекту и робототехнике. Англо-русский толковый словарь по робототехнике и искусственному интеллекту Э. М. Пройдаков, Л. А. Теплицкий. — Москва; Берлин: Директ-Медиа, 2019.
  6. Реформатский А. А. Введение в языковедение/Под ред. В. А. Виноградова. — М.: Аспект Пресс, 1996.\
  7. Токарев Б. Е., Токарев Р. Б. Анализ рынка искусственного интеллекта: динамика патентования технологий Практический маркетинг. 2020, № 1 (275).
  8. Ясницкий, Л. Н. Введение в искусственный интеллект: учеб. пособие для студ. вузов Л. Н. Ясницкий. — М.: Академия, 2005.
Основные термины (генерируются автоматически): искусственный интеллект, русский язык, язык перевода, термин, область, перевод, сфера, исходный язык, перевод терминов, слово.


Похожие статьи

Задать вопрос