Применение технологии распознавания речи в бизнесе | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 22 августа, печатный экземпляр отправим 9 сентября.

Опубликовать статью в журнале

Автор:

Рубрика: Технические науки

Опубликовано в Молодой учёный №26 (316) июнь 2020 г.

Дата публикации: 24.06.2020

Статья просмотрена: 8 раз

Библиографическое описание:

Зборенко, А. А. Применение технологии распознавания речи в бизнесе / А. А. Зборенко. — Текст : непосредственный // Молодой ученый. — 2020. — № 26 (316). — С. 45-47. — URL: https://moluch.ru/archive/316/72055/ (дата обращения: 08.08.2020).



В статье кратко описан процесс развития систем распознавания речи, приведён пример принципа работы одной из таких систем и кратко описаны бизнес-задачи, решаемые с помощью таких систем.

Ключевые слова: клиент, робот, система.

Каждый предприниматель стремится увеличить свой доход и этого можно достичь разными способами, в том числе за счёт автоматизации рутинных процессов. Этому способствует внедрение новых технологий, таких как системы автоматического распознавания речи и её анализа. Их уже повсеместно внедряют банки, сотовые операторы, различные call-центры и т. д. Когда людям нужна оперативная помощь в решении какого-либо вопроса (банкомат не отдаёт карту, хочется переключиться на новый тариф, узнать по какой причине выключили электричество и когда его снова включат), самым быстрым способом является звонок. За счёт этого компаниям необходимо тратить огромное количество ресурсов на обеспечение технической поддержки. Хотя задачи, решаемые отделом технической поддержки, не являются сложными, они имею большое значение для имиджа и репутации, а от них напрямую зависит доход. Понимание того, как работают эти системы, позволит увидеть больше возможностей для внедрения роботов, распознающих речь.

В статье используется понятие «клиент». Под ним подразумевается как лицо, которое уже пользуется услугами организации, так и потенциальный клиент, который не пользуется услугами организации.

Эволюция систем распознавания речи

Первое поколение, Interactive Voice Response (IVR), использовалось (и до сих пор где-то используется) для того, чтобы направить клиента к нужному ему специалисту, используя вопросы в стиле «Если Вы хотите узнать о нашем новом тарифе, нажмите «один», если Вы хотите подключить дополнительные опции, нажмите «два»». В данной нише самыми развитыми считаются системы, которые могут распознать ответы человека: «да» или «нет».

Далее были придуманы роботы, которые доносили какую-либо информацию до клиента. Обычно, для этого использовали синтез речи и голос робота звучал механически. Однако в некоторых случаях используют заранее записанные отдельные слова человека и робот, распознавая написанный текст, просто проигрывал эти слова. Такую систему можно встретить на некоторых сервисах голосовой почты. Голос робота вроде звучит по-человечески, но слова произносятся с большой паузой (около 0,7–1 с. между словами).

Следующей ступенью стало умное распознавание речи. Когда клиент звонит оператору и описывает свою проблему, робот анализирует слова клиента и моментально выдаёт оператору информацию на экране, необходимую для обслуживания клиента [1]. Это позволяет сделать каждого специалиста универсальным, что обеспечивает более комфортный сервис и делает рабочую силу более дешёвой, так как уже нет необходимости нанимать узкопрофильных специалистов.

Последним поколением, нынешним, являются AI-роботы (Artificial Intelligence — искусственный интеллект), которые используют методы машинного обучения и учатся на истории диалогов, пытаясь максимально приблизиться к естественной человеческой речи. Это достигается благодаря технологиям распознавания речи и семантического анализа естественного языка.

Принцип работы AI -роботов

Разберём принцип работы современного AI-робота, взяв за основу систему, предлагаемую международной фирмой Neuro.net Inc для коммерческого использования. [2]

Для того, чтобы система поняла, что от него требуется, процесс распознавания делится на два этапа.

Первый этап — перевод речи в текстовый формат для дальнейшей работы с ним. Для этого часто используются готовые решения вроде Yandex SpeechKit или Google Speech Recognition, считающиеся одними из самых точных. Если требуется обработка речи в реальном времени, то часто используют модель MRCP (Media Resource Control Protocol — протокол управления медиа-ресурсами).

Второй этап — это семантический анализ, т. е. понимание сказанного. Одной из таких технология является NLU (Natural-language understanding — понимание естественного языка). Она ищет объекты распознавания — сущности и намерения. Чтобы понять, что это означает, давайте рассмотрим пример. Допустим, клиент сказал: «Я бы хотел узнать об условиях подробнее, но сейчас я на работе, не могли бы вы перезвонить вечером после 19-ти часов?».

Сущности:

– «Вечером»;

– «После 19-ти часов».

Намерения:

– «Я бы хотел узнать подробнее»;

– «Я на работе»;

– «Могли бы вы перезвонить».

Робот на основе объектов распознавания переводит слова человека в понятные для себя значения (например, сущность «time_to_call_back» он установит в значение «19» при условии, что «call_back» равен «true»).

В процессе распознавания голоса может появиться проблема шума: в разговоре голос клиента перемешивается со сторонними звуками и это затрудняет процесс распознавания. Во-первых, следует учитывать тот факт, что человек не говорит без перерыва, он делает смысловые паузы и переводит дыхание. Робота учат делить запись на части, где пауза является концом очередной части. Это позволяет исключить из анализа лишние данные. Во-вторых, систему обучают определять шум, основываясь на записях этих самых шумов (шум автомобиля, кипение воды, скрип двери, шаги и так далее), то есть по итогу если робот слышит шум, то он знает, что это мусор, который следует отсечь. Это позволяет вести диалог, не зацикливаясь на распознавании стороннего шума.

Бизнес-задачи, решаемые с помощью AI-роботов

  1. Проведение исследований и опросов . Система может самостоятельно обзвонить клиентов и узнать их мнение по какой-либо теме, основываясь на списке заранее заготовленных вопросов. Задача не является сложной ни для человека, ни для робота, так как часто используются шкалы оценивания, например, от 1 до 10.
  2. Предложение персональных продуктов . Сервис по работе с клиентами Segment провёл исследование и установил, что около 49 % людей приобретают что-либо, что не собирались покупать, если они получают персональное предложение [3]. Робот может проанализировать действия клиента и, ориентируясь на его предпочтения, подобрать ему наиболее подходящий продукт. Такой анализ используется в связке с технологиями распознавания возраста (чтобы не предлагать услуги и товары несовершеннолетним), определения пола (позволяет обращаться к человеку соответствующим образом) и идентификации личности (на случай, если на звонок ответил кто-то другой).
  3. Сбор и обработка информации . Если оператор должен получить какую-либо информацию и занести её в базу данных, то с этим отлично справится робот. Если заранее знать о том, какого рода информация должна поступить и какие типовые вопросы может задать клиент, то остаётся лишь настроить систему соответствующим образом. Если же возникнет нестандартная ситуация, то робот сам переведёт звонок на живого оператора.
  4. Холодные звонки . Холодные звонки часто происходят по одному и тому же сценарию: оператор звонит клиенту, спрашивает, как можно обратиться, и рассказывает об услуге или продукте. Если клиент заинтересован, то оператор продолжает диалог. Часто клиент отказывается от предложения и оператор переходит к следующему. Эту стадию на себя может взять робот, он определит степень заинтересованности клиента и в случае успеха переключит его на живого оператора. Преимуществом такого сценария является скорость и рациональное использование человеческих ресурсов. Робот может отслеживать готовность операторов обработки лидов и если возникает ситуация, когда нет свободного оператора, то система останавливает обзвон.
  5. Найм сотрудников . Самым долгим этапом в найме новых сотрудников — это первичный отбор кандидатов. При этом он же и самый однообразный. Робот способен сделать рутинный обзвон кандидатов и сообщить им время и место для собеседования, а также ответить на некоторые вопросы, касающиеся будущей работы. При этом система оценивает удовлетворённость кандидата условиями работы. Работа робота не прекращается после найма людей, он способен продолжать отвечать на часто задаваемые вопросы вроде даты получения зарплаты, графика отпусков или порядка начисления премий.

Заключение

Конечно, это не весь список задач, решаемых с помощью систем распознавания речи. Да и область их применения выходит за рамки ведения бизнеса. Однако при внедрении подобных систем необходимо чётко понимать, что именно и как требуется улучшить, иначе вместо выгоды есть большой риск понести крупные потери.

На данный момент существует мало подрядчиков, способных правильно и эффективно внедрить систему и следует тщательно подходить к их выбору. За ошибки программистов будут расплачиваться заказчики.

В будущем отпадёт надобность в работниках call-центра, хотя и случится это не скоро. Опыт индустриальной революции показал, что люди могут тяжело переживать перемены, и не каждый способен идти в ногу с прогрессом. Но не стоит думать, что «машины забирают нашу работу». Исчезновение старых профессий и появление новых — естественный процесс, который длится всю историю человечества.

Литература:

1. Текст: электронный // voximplant: [сайт]. — URL: https://voximplant.ru/blog/kejs-sberbanka-iskusstvennyj-intellekt-dla-kontakt-centra (дата обращения: 21.06.2020).

2. Текст: электронный // rusbase: [сайт]. — URL: https://rb.ru/opinion/luchshe-zhivyh-operatorov/ (дата обращения: 21.06.2020).

3. Текст: электронный // Segment: [сайт]. — URL: http://grow.segment.com/Segment-2017-Personalization-Report.pdf (дата обращения: 21.06.2020).

Основные термины (генерируются автоматически): робот, система, клиент, принцип работы, естественный язык, живой оператор, какая-либо информация, семантический анализ, техническая поддержка, IVR.


Ключевые слова

система, клиент, робот

Похожие статьи

Семантический анализ текстов. Основные положения

Семантический (смысловой) анализ текста – одна из ключевых проблем как теории создания систем искусственного интеллекта, относящаяся к обработке естественного языка (Natural Language Processing, NLP) , так и компьютерной лингвистики.

Семантика в задачах автоматической обработки данных

С когнитивной точки зрения естественный язык (ЕЯ) [4] представляет знаковую систему

ЕЯ позволяет хранить информацию в формализованном виде с помощью лексических единиц

Для реализации семантического анализа с использованием РСМ на практике используется...

Анализ методов тематического моделирования текстов на...

В работе рассматриваются различные методы тематического моделирования текстов на естественном языке, приводятся их достоинства и недостатки. Ключевые слова: тематическое моделирование, векторная модель, латентный семантический анализ...

Обзор систем машинного перевода | Статья в журнале...

Основной принцип работы таких систем — связь структур исходного и конечного текстов.

К недостаткам систем на основе грамматических правил относят необходимость создания, поддержки и

Статистические системы при своей работе используют статистический анализ.

Методы распознавания речи, современные речевые технологии

В данной статье мы проведем обзор развития систем распознавания речи, рассмотрим основные принципы их построения, а также актуальные области применения и перспективы развития систем распознавания речи.

Семантическое моделирование 3D-контента с использованием...

Основной принцип проектирования онтологии — поддержка функций, необходимых для

Мульти дисциплинарная визуализация информации по своей сути является сложной, и для

Многочисленные работы были посвящены семантическому описанию и семантическому...

Параллели между естественными языками и языками...

Язык — это знаковая система, используемая для целей коммуникации и познания.

Искусственные языки создаются людьми для специальных целей либо для определенных

По некоторым данным, в мире насчитывается около 7000 естественных живых языков и...

Чат-боты для автоматизации внутренних коммуникаций

Совмещение технологий понимания естественного языка и интеграций сторонних систем позволяет создавать полезных помощников для самых разных областей — от аналитики

Язык разметки определяет сценарий поведения чат-бота и его реакции на различные сообщения.

Методология реализации естественно-языкового...

Ограниченный естественный язык — это подмножество естественного языка, текст на

Цикл работы естественно-языкового интерфейса начинается с ввода пользователем сообщения

Таким образом, достоверно не может быть известно какая из частей является корнем, а какая...

Разработка вопросно-ответной системы с использованием...

Обоснована задача создания автоматизированной вопросно-ответной системы.

Результатом работы системы будет ответ на тот вопрос из базы, косинусное сходство с которым

Системы семантического анализа способны найти применение в большом количестве социальных...

Похожие статьи

Семантический анализ текстов. Основные положения

Семантический (смысловой) анализ текста – одна из ключевых проблем как теории создания систем искусственного интеллекта, относящаяся к обработке естественного языка (Natural Language Processing, NLP) , так и компьютерной лингвистики.

Семантика в задачах автоматической обработки данных

С когнитивной точки зрения естественный язык (ЕЯ) [4] представляет знаковую систему

ЕЯ позволяет хранить информацию в формализованном виде с помощью лексических единиц

Для реализации семантического анализа с использованием РСМ на практике используется...

Анализ методов тематического моделирования текстов на...

В работе рассматриваются различные методы тематического моделирования текстов на естественном языке, приводятся их достоинства и недостатки. Ключевые слова: тематическое моделирование, векторная модель, латентный семантический анализ...

Обзор систем машинного перевода | Статья в журнале...

Основной принцип работы таких систем — связь структур исходного и конечного текстов.

К недостаткам систем на основе грамматических правил относят необходимость создания, поддержки и

Статистические системы при своей работе используют статистический анализ.

Методы распознавания речи, современные речевые технологии

В данной статье мы проведем обзор развития систем распознавания речи, рассмотрим основные принципы их построения, а также актуальные области применения и перспективы развития систем распознавания речи.

Семантическое моделирование 3D-контента с использованием...

Основной принцип проектирования онтологии — поддержка функций, необходимых для

Мульти дисциплинарная визуализация информации по своей сути является сложной, и для

Многочисленные работы были посвящены семантическому описанию и семантическому...

Параллели между естественными языками и языками...

Язык — это знаковая система, используемая для целей коммуникации и познания.

Искусственные языки создаются людьми для специальных целей либо для определенных

По некоторым данным, в мире насчитывается около 7000 естественных живых языков и...

Чат-боты для автоматизации внутренних коммуникаций

Совмещение технологий понимания естественного языка и интеграций сторонних систем позволяет создавать полезных помощников для самых разных областей — от аналитики

Язык разметки определяет сценарий поведения чат-бота и его реакции на различные сообщения.

Методология реализации естественно-языкового...

Ограниченный естественный язык — это подмножество естественного языка, текст на

Цикл работы естественно-языкового интерфейса начинается с ввода пользователем сообщения

Таким образом, достоверно не может быть известно какая из частей является корнем, а какая...

Разработка вопросно-ответной системы с использованием...

Обоснована задача создания автоматизированной вопросно-ответной системы.

Результатом работы системы будет ответ на тот вопрос из базы, косинусное сходство с которым

Системы семантического анализа способны найти применение в большом количестве социальных...

Задать вопрос