Компьютерная лингвистика как синтез лингвистики, информатики и искусственного интеллекта | Статья в сборнике международной научной конференции

Отправьте статью сегодня! Журнал выйдет 29 июня, печатный экземпляр отправим 3 июля.

Опубликовать статью в журнале

Автор:

Рубрика: 4. Информатика

Опубликовано в

LXXXII международная научная конференция «Исследования молодых ученых» (Казань, май 2024)

Дата публикации: 15.05.2024

Статья просмотрена: 23 раза

Библиографическое описание:

Григорьев, Д. В. Компьютерная лингвистика как синтез лингвистики, информатики и искусственного интеллекта / Д. В. Григорьев. — Текст : непосредственный // Исследования молодых ученых : материалы LXXXII Междунар. науч. конф. (г. Казань, май 2024 г.). — Казань : Молодой ученый, 2024. — С. 75-79. — URL: https://moluch.ru/conf/stud/archive/516/18522/ (дата обращения: 18.06.2024).



В статье представлен обзор компьютерной лингвистики — междисциплинарной области, объединяющей лингвистику, информатику и искусственный интеллект для изучения и моделирования естественного языка. Рассматриваются цели и задачи компьютерной лингвистики, её история развития, основные концепции, такие как естественный язык, обработка естественного языка, машинное обучение и глубокие нейронные сети. Приводятся примеры практических применений компьютерной лингвистики, таких как виртуальные помощники, машинный перевод, проверка орфографии и грамматики, анализ мнений в социальных сетях.

Ключевые слова : компьютерная лингвистика, естественный язык, обработка естественного языка, машинное обучение, глубокие нейронные сети, виртуальные помощники, машинный перевод, проверка орфографии и грамматики, анализ мнений в социальных сетях.

Введение

Компьютерная лингвистика представляет собой междисциплинарную область, которая объединяет лингвистику, информатику и искусственный интеллект для изучения и моделирования естественного языка. Целью компьютерной лингвистики является разработка программного обеспечения, способного понимать, обрабатывать и генерировать естественный язык, а также автоматизация лингвистических задач, таких как машинный перевод, анализ текстов и распознавание речи [1]. Кроме того, компьютерная лингвистика используется для изучения лингвистических явлений с помощью компьютерных методов, чтобы выявить закономерности функционирования естественного языка и создать лингвистические теории.

Актуальность исследования

В настоящее время компьютерная лингвистика является одной из наиболее быстроразвивающихся областей науки, которая объединяет лингвистику, информатику и искусственный интеллект для изучения и моделирования естественного языка. Развитие компьютерной лингвистики имеет важное значение для решения многих практических задач, таких как машинный перевод, распознавание речи, анализ текстов и прочее. Кроме того, компьютерная лингвистика используется для изучения лингвистических явлений с помощью компьютерных методов, что позволяет выявить закономерности функционирования естественного языка и создать лингвистические теории.

Цели и задачи исследования

Целью данного исследования является предоставление обзора компьютерной лингвистики, ее истории развития, целей и задач, основных концепций, таких как естественный язык, обработка естественного языка, машинное обучение и глубокие нейронные сети. В рамках исследования будут рассмотрены практические применения компьютерной лингвистики, такие как виртуальные помощники, машинный перевод, проверка орфографии и грамматики, анализ мнений в социальных сетях.

Объект и предмет исследования

Объектом исследования является компьютерная лингвистика как междисциплинарная область, объединяющая лингвистику, информатику и искусственный интеллект. Предметом исследования являются цели и задачи компьютерной лингвистики, ее история развития, основные концепции и практические применения.

Методы исследования

В качестве методов исследования будут использованы анализ литературы, сравнительный анализ, а также примеры практических применений компьютерной лингвистики. Анализ литературы будет проводиться с целью изучения истории развития компьютерной лингвистики, ее целей и задач, основных концепций. Сравнительный анализ будет проводиться с целью сравнения различных подходов и методов в области компьютерной лингвистики. Примеры практических применений будут использоваться для демонстрации возможностей компьютерной лингвистики в решении практических задач.

1. Определение и цели компьютерной лингвистики

Компьютерная лингвистика имеет долгую историю развития, которая берёт своё начало в XVII веке. Готфрид Вильгельм Лейбниц разработал бинарную систему счисления, которая стала основой для компьютеров, и предложил идею универсального языка, который мог бы быть использован для формального описания знаний. В XIX веке появились первые механические устройства, такие как пишущая машинка и телетайп, которые автоматизировали набор и передачу текста. Однако, настоящее развитие компьютерной лингвистики началось только в середине XX века с появлением электронных компьютеров. Одним из первых проектов в этой области был машинный перевод, который предусматривал автоматический перевод текстов с одного языка на другой [2].

2. Основные концепции компьютерной лингвистики

Естественный язык представляет собой систему символов и правил, которая используется людьми для общения. Естественный язык отличается от искусственных языков, таких как программные языки или языки формальной логики. Свойства естественного языка включают произвольность знака (отсутствие связи между знаком и его значением), двухуровневую структуру (фонетический и семантический уровни), производительность (способность создавать бесконечное количество предложений), контекстную зависимость значений, неоднозначность и изменчивость.

Обработка естественного языка (NLP) представляет собой направление компьютерной лингвистики, которое занимается разработкой алгоритмов и программного обеспечения для анализа, понимания и генерации естественного языка. Методы NLP включают токенизацию (разделение текста на слова), частотный анализ (подсчёт частоты слов), морфологический анализ (разбиение слов на морфемы), синтаксический анализ (определение структуры предложения) и семантический анализ (определение значения слов и предложений).

Машинное обучение (ML) представляет собой направление искусственного интеллекта, которое занимается разработкой алгоритмов и программного обеспечения для автоматического обучения компьютеров на основе данных. Методы ML включают обучение с учителем (алгоритм обучается на основе помеченных данных), обучение без учителя (алгоритм обучается на основе непомеченных данных) и подкрепляющее обучение (алгоритм обучается на основе системы вознаграждений и наказаний) [3].

Глубокие нейронные сети (DNN) представляют собой тип алгоритмов ML, основанный на имитации работы нейронов в человеческом мозге. DNN используются для решения сложных задач обработки данных, таких как распознавание изображений, речи и текста.

3. Примеры практических применений компьютерной лингвистики

Компьютерная лингвистика имеет множество практических применений в различных сферах. Одним из примеров являются виртуальные помощники, такие как Алиса (Яндекс), Маруся (Mail.ru) и Салют (Сбер), которые способны понимать естественный язык и выполнять различные задачи, такие как ответ на вопросы, управление умным домом и настройка будильников [4].

Другим примером является машинный перевод, который предусматривает автоматический перевод текста с одного языка на другой. Примерами сервисов машинного перевода являются Яндекс.Переводчик и PROMT.

Кроме того, существуют инструменты и сервисы, помогающие авторам проверять свои тексты на орфографические и грамматические ошибки, такие как Орфограммка, ReText.AI и Главред.

Ещё одним практическим применением компьютерной лингвистики является анализ мнений в социальных сетях, который предусматривает сбор, обработку и анализ данных из социальных сетей для определения отношения людей к определенному бренду, продукту или услуге. Примерами российских сервисов для анализа мнений в социальных сетях являются Brand Analytics, IQBuzz, Wobot, YouScan, Babkee [5].

Заключение

Компьютерная лингвистика представляет собой быстроразвивающуюся область, которая имеет множество практических применений в различных сферах. Целью компьютерной лингвистики является разработка программного обеспечения, способного понимать, обрабатывать и генерировать естественный язык, а также автоматизация лингвистических задач, таких как машинный перевод, анализ текстов и распознавание речи [6]. Кроме того, компьютерная лингвистика используется для изучения лингвистических явлений с помощью компьютерных методов, чтобы выявить закономерности функционирования естественного языка и создать лингвистические теории. С развитием технологий и алгоритмов, компьютерная лингвистика будет продолжать играть важную роль в решении сложных задач, связанных с обработкой и пониманием естественного языка.

Литература:

  1. Соколова, Е. Г. Компьютерная лингвистика как предметная область, тезаурус по компьютерной лингвистике и речевые технологии / Е. Г. Соколова // Актуальные вопросы теоретической и прикладной фонетики: сборник статей к юбилею О. Ф. Кривновой / Московский государственный университет им. М. В. Ломоносова, Кафедра теоретической и прикладной лингвистики. — Москва: Буки-Веди, 2013. — С. 363–374. — EDN TBBXEV.
  2. Mavljanova, T. B. The role of computer linguistics in the field of philology / T. B. Mavljanova, Sh. N. Ahtamova // Молодой ученый. — 2020. — No. 19(309). — P. 538–540. — EDN LCOKTX.
  3. Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (2022), Москва, 15–18 июня 2022 года. — Москва: Российский государственный гуманитарный университет, 2022. — 614 с. — ISBN 978–5–7281–3205–9. — EDN TAMKYC.
  4. Богуславский, Н. Лучшие голосовые помощники: 4 ассистента с поддержкой русского языка / Н. Богуславский. — Текст: электронный // Т—Ж: [сайт]. — URL: https://journal.tinkoff.ru/best-smart-assistants/ (дата обращения: 14.05.2024).
  5. Глаз да глаз: 6 сервисов для мониторинга упоминаний в соцмедиа. — Текст: электронный // Медиа нетологии: [сайт]. — URL: https://netology.ru/blog/6-servisov-monitoringa-upominaniy-v-socsetyakh (дата обращения: 14.05.2024).
  6. Рынкевич, А. В. Компьютерная лингвистика: использование компьютерных технологий для анализа и обработки языковых данных / А. В. Рынкевич, Д. Я. Гордиенко, Н. Н. Абуева // Педагогический журнал. — 2023. — Т. 13, № 10–1. — С. 512–517. — DOI 10.34670/AR.2023.25.52.089. — EDN TIMGPN.

Ключевые слова

машинный перевод, обработка естественного языка, компьютерная лингвистика, естественный язык, машинное обучение, глубокие нейронные сети, виртуальные помощники, проверка орфографии и грамматики, анализ мнений в социальных сетях