В статье представлена информация о новой информационной технологии в Интернете — голосовой помощник. Исследованы формы, виды, особенности и характеристики голосовых помощников, представляемые разными компаниями. Определен голосовой помощник, как новая информационная технология современного состояния, как реального, так и виртуального мира. Осуществлено исследование голосового помощника, на предмет достоинств и недостатков настоящей информационной технологии.
Ключевые слова: голосовой помощник, Интернет, информационная безопасность, пользователь, гонка вооружений, звук, искусственный интеллект, человеческая речь
The article presents information about a new information technology on the Internet — voice assistant. The forms, types, features and characteristics of voice assistants presented by different companies are studied. The voice assistant is defined as a new information technology of the current state of both the real and virtual world. A study of the voice assistant has been carried out to determine the advantages and disadvantages of this information technology.
Keywords: voice assistant, Internet, information security, user, arms race, sound, artificial intelligence, human speech
На протяжении десятилетий человечество мечтало о голосовом интерфейсе, описанном в научной фантастике. И вот в наше время, благодаря новым информационным технологиям и Интернету, виртуальные голосовые помощники появились и набирают популярность среди пользователей по всему миру.
Для многих компаний голосовые помощники стали служить не просто точкой контакта с потребителями, а дополнительным новым каналом коммуникации. Становится возможным вести необходимей (устный) диалог с человеком (пользователем), что способствует получению дополнительной информации о нем, а также созданию нового опыта взаимодействия. [1]
Актуальность изучаемого вопроса состоит в том, что интеграция голосовых помощников активно внедряется в разные виды жизнедеятельности человека или бизнеса и постепенно становиться неизменной составляющей высокоэффективных и новейших интерактивно-маркетинговых коммуникаций. [2]
История голосовых помощников началась в конце 1930-х годов, когда, по данным экспертов, ученые впервые предприняли попытки распознавать голос человека. В первый раз была анонсирована голосовая система распознавания номеров «Bell». Спустя некоторое время миру был продемонстрирован новый инструмент (система) «Shoebox», который компания «IBM» представила на Всемирной выставке в Сиэтле (США) в 1962 году. Инструмент был способен совершать математические функции, а помимо прочего идентифицировать шестнадцать произносимых слов и чисел от 1 до 9.
Последующим шагом стало решение (система) «Harpy», сформированное учеными из Университета Карнеги-Меллона в Питтсбурге, (штат Пенсильвания, США) в 1970-х годах, которое уже распознало более тысячи слов, т. е. примерный словарный запас трехлетнего ребенка.
Когда появились технологии, распознающие последовательности слов, фирмы начали разрабатывать для них приложения. В 1990-х годах ХХ века такие компании, как «IBM», «Apple» и другие, разрабатывали решения, в которых использовалось распознавание голоса: в 1993 году «Apple» выпустила «Macintosh» с технологией «PlainTalk», а в апреле 1997 года компания «Dragon» презентовала решение, которое могло преобразовывать до сотни слов по одному запросу в минуту.
Дальнейшее развитие пошло в развитии решений для умного дома: в ноябре 2014 года компания «Amazon» презентовала умную колонку «Alexa», два года спустя, в ноябре 2016 года фирма «Google» выпустила систему «Google Home», а в феврале 2018 года на этот рынок снова вышла компания «Apple».
В настоящее время наиболее полным продуктовым решением в области настоящих исследований стала являться новая информационная технология «голосовой помощник», поскольку описываемое решение включает в себя использование всех существующих голосовых технологий. Они включают в себя системы распознавания голоса, системы анализа и обработки речи, системы преобразования текста в речь и голосовую биометрию. [3]
При этом, по мнению экспертов, данная технология «голосовой помощник» на сегодняшний день стала общедоступна и ее можно написать практически на любом языке программирования. Однако наиболее популярным в 2020 году стал высокоуровневый язык программирования «Python». Активность подсистемы происходит от ввода голосовой команды. Полученный сигнал преобразуется в цифровую форму и подвергается фильтрации внешнего шума. Кроме всего прочего, преобразованный сигнал отправляется в подсистему идентификации.
В этой подсистеме сначала делается запрос к базе данных сигналов, чтобы распознать команду. Если введенные и сохраненные сигналы совпадают, обнаружение считается успешным, и команда передается на исполняющее устройство, которое выполняет определенное действие. Если голосовая команда не распознается, система возвращается к началу — вводу голосовой команды, и алгоритм действий повторяется снова до получения положительного результата, то есть до тех пор, пока голосовая команда не будет распознана. [4]
Таким образом можно сказать, что голосовой помощник — это современный сервис на базе искусственного интеллекта, распознающий человеческую речь. Такие помощники имеют все шансы выполнять различные действия в ответ на голосовые команды.
Чаще всего голосовые помощники применяются в смартфонах, умных колонках, а помимо прочего в некоторых современных браузерах. В настоящее время существует сразу несколько общих голосовых помощников, у каждого из которых есть свои сильные и слабые стороны. [5]
Так, например, домашние голосовые помощники — это небольшие колонки, которые можно установить в любом удобном для пользователя месте. Для мобильных устройств используются специальные приложения, которые нужно загрузить на устройство.
Первое место занимает голосовой помощник «Алиса», поддерживающий программой «Яндекс Алиса». Изначально в системе (колонке) установлен русский язык, поэтому использовать устройство будет удобно. Устройство подходит для пользователей «iOS», «Android» и его можно применять, чтобы следить за погодой, воспроизводить музыку и быстро находить нужные ответы. Программа быстро ищет ответы в Интернет-сети и предлагает в наибольшей степени подходящий вариант.
Имеет положительные стороны:
- Подходит для больших помещений;
- Разработана специально для отечественных пользователей;
- Поддерживает функционал «Яндекса».
Также обладает и отрицательными сторонами:
- Помощник не всегда предоставляет четкие ответы;
- Пользователи часто получают шуточные ответы вместо точного ответа.
Другим голосовым помощником, менее популярным, является «Google Nest Mini» (2nd gen), который представляет собой доступный по цене динамик, используемый в салоне автомобиля и дома. «Google Ассистент» уже установлен на приобретенном устройстве, подключаемом по Wi-Fi или Bluetooth. Устройство можно закрепить на стене, а благодаря трем динамикам пользователи могут получать нужную информацию в любой точке дома. Устройство позволяет принимать наиболее актуальную информацию и слушать музыку.
Положительными сторонами является: 1. Четкость звука; 2. Быстрое формирование ответов на поставленные вопросы.
Отрицательные стороны: 1. Необходимость языковой настройки; 2. Предустановлен англоязычный языковой пакет.
Третье место занимает ассистент (голосовой помощник) «Apple Siri», установленный в специальные колонки или на иное устройство «Apple». Для дома целесообразно применять динамик, оснащенный чувствительными динамиками, быстро распознающие команды. Можно также применять в автомобиле. Программа имеет возможность распознавать почти все типы языков. При желании может отвечать на вопросы мужским или женским голосом. Данная система широко применяется в сотовых телефонах. Быстро работает на устройствах «iOS: iPhone», «Apple TV», «iPad» и «Apple Watch». Можно применять голосового помощника для управления звонками, музыкой и приложениями.
Имеет положительные стороны: 1. Четкость звука; 2. Быстрота распознавания команды; 3. Простота управления.
Отрицательные стороны: применение только с устройствами «Apple».
Таким образом можно сказать, что новая информационная технология «голосовые помощники», созданные специально для персональных компьютеров, помогают людям (пользователям) осуществлять поиск необходимой информации.
И в данном случае можно сказать, что, по данным экспертов, первое место в данном кластере занимает домашний голосовой помощник под названием «Горыныч», упрощающий использование компьютера.
Используя голосовые команды, имеется возможность управлять приложениями и мышью, а объем словаря позволяет четко распознавать команды. При желании словарь можно периодически пополнять новыми словосочетаниями. Скачать помощника можно абсолютно в любом браузере.
В свою очередь необходимо обозначить, что помощник занимает небольшой объем памяти, по этой причине никак не повлияет на скорость функционировать персонального компьютера.
Положительные стороны: 1. Быстрота поиска запрашиваемой информации; 2. Возможность текстового набора; 3. Запуск приложений, присутствующих на персональном компьютере.
Отрицательные стороны: пользователями и специалистами минусы не выявлены.
Второе место занимает ассистент (голосовой помощник) «Cortana», предоставляемый для системы «Microsoft». Его поддерживают такие системы, как «Android», «Xbox One», «Microsoft Phone» и «Microsoft Band». Поэтому его можно установить на планшеты. С помощью «Cortana» можно спланировать день, узнать маршрут или найти требуемые данные, а также ознакомиться с электронными письмами и найти нужную музыку. Помимо прочего помощник может открыть нужное приложение, если руки пользователя заняты.
Положительные стороны: 1. Простота установки. 2. Применяется на компьютерах и телефонах.
Отрицательные стороны: 1. Пользователями и специалистами минусы не выявлены.
На третьем месте — относительно новая отечественная программа (голосовой помощник) «Маруся», только начинающая набирать популярность. Помощник можно установить на персональные компьютеры, планшеты или смартфоны. Программа выпущена «Mail.ru Group». Посредством помощника пользователи имеют все шансы быстро найти в Интернете нужную информацию. Помимо прочего помощник оповестит о значимой дате и поминутно спланирует день.
Положительные стороны: 1. Высокая скорость обработки запросов; 2. Применяется на компьютерах и телефонах; 3. Максимальная простота установки на устройство.
Отрицательные стороны: может применяться только при наличии гражданства Российской Федерации.
Наряду с представленной информацией хочу отметить, что голосовые помощники — это наиболее часто используемые смартфоны.
Посредством приложений пользователи имеют все шансы открывать дополнительные вкладки и использовать мобильное устройство в режиме громкой связи.
На первом месте — довольно популярная программа «Google Assistant». Наиболее популярная система для смартфонов может распознавать до трех десятков языков, поддерживает такие системы, как браузеры «Android», «iOS» и «Chrome». Для применения требуется установить и активировать программу фразой «Окей, Google». Благодаря помощнику прокладывается необходимый маршрут, можно узнать погоду или позвонить, если руки пользователя заняты. Можно написать сообщение, найти и открыть нужное приложение.
Положительные стороны: 1. Высокая скорость работы; 2. Быстрый поиск необходимой информации.
Отрицательные стороны: формирует слишком краткие ответы на запросы.
На втором месте — современный голосовой помощник «Дуся», способный включаться голосом или при взмахе руки. Пользователь может заблаговременно формировать задачи и самостоятельно их выполняет в нужном режиме. Помощник своевременно напомнит о важных делах и отправит сообщение. Также с помощью умного помощника можно узнать интересующую информацию.
Положительные стороны: 1. Простота управления; 2. Возможность самостоятельно формировать функции; 3. Возможность работы без голосовой команды.
Отрицательные стороны: отсутствует бесплатный формат использования.
Третье место занимает помощник «Amazon Alexa». Данное приложение надлежит отнести к категории универсальных и часто устанавливается на мобильный телефон. Вместе с тем голосовой помощник также очень популярен в управлении домом. Приложение позволяет писать письма, устанавливать любимую музыку, искать информацию в сети и т. д.
Для домашнего использования нужно купить специальное устройство и с его помощью можно открывать жалюзи, включать свет, музыку и открывать двери. После установки устройство активируется и реагирует исключительно на определенные голоса.
Положительные стороны: 1. Универсальное применение; 2. Функционирует быстро; 3. Может открывать приложения.
Отрицательные стороны: пользователями и специалистами минусы не выявлены.
Перечисленные выше голосовые помощники чрезвычайно популярны.
Однако, нельзя не отметить и специальных голосовых помощников от отечественных разработчиков:
- «Маруся» — голосовой помощник, разработанный компанией «Mail.ru Group». Запущен 17 июня 2019 года в тестовом режиме. «Маруся» доступна на платформах «iOS» и «Android» в виде отдельного приложения. (некоторая информация была представлена выше).
- «Олег» — виртуальный голосовой помощник в сфере финансов и лайфстайл-услуг, разработанный группой «Тинькофф». Он работает в мобильном приложении «Тинькофф». Общаться с ним можно с помощью голоса или используя мобильную клавиатуру.
- «Григорий» — новинка от «Беру.ру», занимающийся обзвоном всех клиентов маркетплейса, охватывая в том числе и пилотный сегмент пользователей.
- «Александра» — современный метро-бот успешно функционирует в мобильном приложении «Метро Москвы», мессенджерах и социальных сетях метрополитена, использует искусственный интеллект и машинное обучение.
- «Елена» — виртуальный оператор службы поддержки компании «Мегафон», готовый проконсультировать абонентов по большинству возникающих вопросов, умеющий работать с пользователями как в голосовом, так и в текстовом формате.
- «Марвин» — голосовой помощник от фирмы «МТС», способный подсказать погоду, прочитать книгу или сказку, включить музыку, озвучить последние новости, составить список дел, управлять «Умным домом».
- Чат-бот «Вася» — миграционный помощник Главного Управления по вопросам миграции МВД России.
Таким образом необходимо отметить, что данные помощники активно входят в нашу жизнь и с каждым днем все больше людей используют их повседневной жизни.
Но… выбирая голосового помощника, нужно учитывать функции, значимые для пользователя. Каждый голосовой помощник имеет собственный индивидуальный функционал, который систематически обновляется. При выборе правильной интеллектуальной системы очень важно учитывать индивидуальные критерии. [6]
Экспертами проведены тесты некоторых систем, как «Google», «Alice», «Siri», программного обеспечения от «Microsoft» и «Amazon», которые выводили в поисковиках на первую страницу. По их мнению, особенно популярными стали «Google Assistant» и «Яндекс Алиса». Данные голосовые помощники давали более правильные ответы на вопросы экспертов. Между тем эксперты говорят, что не все голосовые помощники идеальны и таким образом нуждаются в доработке.
В этой связи интеграция голосовых помощников в разнообразные устройства в будущем, может привести к тому, что маркетологам будет нужно скорректировать подход к общению с пользователями, сделать его более персональным, но решить данную задачу можно будет только в том случае, если компании найдут способ качественно защищать голосовых ассистентов от мошенничества. [7]
Однако, даже уже сейчас, созданные современные голосовые помощники позволили заметно сократить временные затраты на выполнение простых, рутинных ежедневных задач и это показали представленные выше исследования.
При этом функционал, которым обладают голосовые помощники, довольно обширный, поэтому такие сервисы обеспечивают общение с пользователем, поиск информации в Интернет-сети и короткие ответы на пользовательские запросы, вызов такси, звонки и написание сообщений, включение музыки и работу будильника, составление маршрута движения с поиском требуемых объектов в пути следования. Также голосовыми помощниками всегда учитывается местоположения пользователя, временная составляющая и день недели, а кроме прочего, сервис осуществляется с учетом истории всех предыдущих пользовательских запросов.
Как, пример, можно представить отдельные отрасли экономики, где они нашли применение.
Голосовые помощники в настоящее время присутствуют в различных сферах деятельности и индустриях, а интегрируются они зачастую самыми нестандартными форматами. Например, «Zyrtec» является хорошо известным брендом противоаллергенных средств, нанявшим voice-ассистента, который рассказывает пользователям полезные сведения о факторах риска для людей, страдающих аллергическими реакциями. Виртуальные боты компании «Tide» способны научить выводить пятна, а особенностью цифровых помощников сервиса по поиску вакансий на сайте «hh.ru» является подбор предложений о вакансиях или подача информации о размерах средних заработных плат. В то же время компания «Nike» тоже приняла решение облегчить жизнь клиентам, поэтому завязывать шнурки можно посредством голосового управления при помощи айфона или умных часов.
Помимо сугубо «имиджевых» решений и их внедрений в настоящее время существуют отраслевые направления, в которых голосовыми технологиями оказывается прямое влияние на уровень эффективности и выполнение вполне конкретных задач.
Например, с точки зрения ритейлинга, посредством голосовых ассистентов осуществляются онлайн-покупки, а североамериканскими ритейлерами голосовые технологии применяются с целью полноценной автоматизации торговых процессов. При этом, не секрет, что популярность голосовых технологий в сфере онлайн-шоппинга обусловлена повышением клиентского комфорта: поисковик легко может ответить на вопрос: «Где купить пальто по самой доступной цене?» или грамотно проконсультирует по вопросам выбора товара.
В общемировом масштабе самые современные голосовые помощники постепенно становятся неотъемлемой частью команды (компании) именно в тех нишах розничной торговой сети, которые характеризуются быстрым повторным использованием клиентских заказов.
Среди законодателей моды в настоящее время можно отметить известных лидеров своих отраслей, таких как «Amazon» и «McDonald's».
Наряду с этим можно отметить, что голосовые помощники представляют собой очень мощный инструмент для получения данных, мониторинга и улучшения качества обслуживания, оптимизации процессов и контроля соблюдения корпоративных стандартов. Например, разработка и введение в эксплуатацию робота «Почты России» на базе технологии «Yandex SpeechKit» облачной платформы «Yandex.Cloud», показало эффективность его работы в таких сферах, например, как принятие апелляции, определение первопричины инцидента, а также стандартная регистрация и присвоение номера апелляции при отправке любого пользовательского запроса на стадию принудительного исполнения.
В банковском секторе голосовые запросы могут использоваться практически так же, как и в розничной торговле, то есть на уровне повторяющихся заказов, включая микрозаймы. Голосовые помощники уже доказали свою высокую эффективность и в области медицины. Голосовые интерфейсы становятся личными врачами с огромным опытом: их «карта памяти» практически неисчерпаема.
Умные помощники не только грамотно проконсультируют пользователя, но также профессионально пропишут схему терапии. В то же время роботы редко что-либо забывают или теряют из виду во время обработки анализов. Одним из ярких примеров такого подхода сегодня является медицинская система «Triad Health AI», которая использует в своей работе «Google Home» и «Amazon Alexa» для лечения болезни Паркинсона.
Наряду с этим, можно сказать, что очевидным является и тот факт, что узкоспециализированные ниши, включая реализацию инженерного оборудования, еще долго останутся на так называемой технологической периферии. Такие направления еще не вышли на массовый формат онлайн-продаж, не говоря уже об использовании голосовых помощников.
Таким образом необходимо отметить, что голосовые помощники в будущем будут активно развиваться, модернизироваться и совершенствоваться, найдут новые сферы применения, но один важный аспект у них будет все активней и активней развиваться, т. е. как только голосовой помощник распознает речь и переведет ее в текстовый формат, он должен понять, какой ответ ожидает о него пользователь.
Например, в «Алисе» клиентские запросы первоначально сортируются именно по намерениям, и только затем перенаправляются в тематические разделы, включая прослушивание музыкальных файлов или неформальный разговор. Таким образом, ключевая задача классификатора намерений состоит в определении, что конкретно имел в виду пользователь под своей фразой. В классификаторе намерений запрос разделен на слова и знаки препинания. Для них используются вложения, обученные очень большим данным, или специальные представления слов, позволяющие понять, в каком контексте все указанные пользователем слова обычно используются.
Для каждого намерения есть специальный шаблон, который выделяет полезную информацию из того, что уже сказал пользователь. Это называется семантическим теггером. Задавая вопросы, люди крайне редко говорят всю информацию, на которую им нужно ответить, поэтому голосовой помощник должен заполнить пробелы самостоятельно.
К примеру, чтобы представить информацию о погоде в конкретном городе человеку (пользователю), помощник может задать пользователю необходимые уточняющие вопросы или получить всю необходимую информацию сам, если на устройстве включена опция геолокации, что является важным преимуществом системы.
Определенным преимуществом является, что запрос, даже если он не соответствует ни одному из сценариев, не игнорируется, а должен быть перенаправлен в поиск или в модуль для неформальных разговоров. В «Алисе», например, этот модуль называется «Болталка». Голосовые помощники очень часто используются не для того, чтобы учить или делать что-то конкретное, а для игры: спросите помощника, какие книги он любит или что носит.
Эта задача решается с помощью стандартных редакционных ответов, потому что разработчики голосового помощника отбирают сотни наиболее популярных вопросов среди пользователей, и на каждый из них прописывает несколько вариантов ответа. При этом, все ответы должны быть написаны в едином стиле, чтобы они составляли целостное представление о конкретном ассистенте.
Чтобы ответить на неконкретные вопросы и не классифицируемые предложения, голосовые помощники обычно используют простые обученные нейронные сети на основе текстов из СМИ, книг и фильмов. Таким образом, например, «Алиса» учится на разнообразных материалах, в которых персонажи, среди прочего, ругаются и спорят.
Исходя из этого, голосовые помощники способны узнавать что-то принципиально отличное от той конкретики, которую предлагают непосредственно разработчики. В ситуациях, когда сам голосовой помощник не знает о существовании определенных выражений, он ответит на них совершенно бездумно, чисто случайными фразами, потому что указанные такие слова ему останутся неизвестными.
Безусловно, на первый взгляд преимущества голосовых помощников вполне очевидны. В настоящее время люди хотят немедленно получать информацию в Интернет-пространстве. Ритм и особая динамика жизни не позволяют тратить много времени на текстовые интерфейсы, а справочные службы финансовых учреждений, государственных структур, а также самых востребованных телефонных сервисов в современных реалиях переполнены пользовательскими обращениями. В этом контексте голосовые помощники способны в некотором роде спасти положение и решить определенные проблемы в сложившейся ситуации.
Обсуждения голосовых и разговорных интерфейсов, как правило, охватывают сразу несколько систем. Начиная с ботов, которые отвечают на простейшие вопросы или шутят только наугад, до сложных систем, используемых на промышленном уровне.
Например, удивительно хорошая система голосового интерфейса сейчас представлена с точки зрения подачи налоговой декларации в Англии. При этом, ключевыми игроками в данной сфере по-прежнему остаются «Alexa» от «Amazon», «Siri» от «Apple», «OK» от «Google», а также «Cortana» от «Microsoft». Востребована и система «Alibaba», являющаяся очень хорошо продуманным помощником для китайских пользователей.
Еще одной особенностью на что необходимо обратить внимание, это то, что компании, у которых есть достаточные ресурсы, требуемые знания и необходимые навыки, чтобы сделать значительный шаг вперед и добиться огромных изменений в развитии голосовых помощников, как не странно, совсем не заинтересованы в таком шаге. Голосовые интерфейсы и голосовые помощники представляют собой инновации, которые кардинально изменяют сложившееся на данный момент состояние дел. [8]
Например, «Google» зарабатывает деньги на рекламе. Если вместо ссылок, рядом с которыми отображается реклама, пользователь начинает получать уже готовый ответ, возникает обоснованный вопрос, что делать с рекламой. Или, «Siri», являющийся отличным помощником для увеличения продаж «iPhone». Им выполняется своя собственная узкоспециализированная работа, и для известной компании в настоящее время не имеет смысла делать что-то новое, что трансформирует уже сложившуюся экосистему «App Store».
Пользовательское ожидание предполагает, что человек в обозримом будущем сможет естественным образом выражать свои желания, и система будет их полностью понимать. По этой причине система обязательно должна будет адаптироваться к человеку, а не наоборот. Таким образом, создание наиболее современных и перспективных голосовых помощников следует рассмотреть, скорее всего, с точки зрения понимания общечеловеческих характеристик. [9]
Тем не менее, нельзя не принимать во внимание и опасности, угрозы, которые таит в себе современная технология в виде голосовых помощников. Широкое распространение голосовых помощников и развитие Интернета вещей поднимают вопрос безопасности для всех тех, кто активно пользуется этими современными технологиями. [10]
Многие владельцы голосовых помощников и домашних умных динамиков, легко распознающих команды, довольно серьезно обеспокоены тем, какой объем информации получают указанные устройства, записывая разговоры. Несмотря на тот факт, что сама по себе зашифрованная речь, как правило, сохраняется именно на серверах разработчика, микрофон можно отключить, а любые записи легко удаляются ручным способом, но рассматриваемая технология ещё очень, очень далека от совершенства и что от нее ждать не всегда ясно и понятно.
Данного мнения придерживаются разные эксперты, которые говорят, что в будущем технические средства будут развиты таким образом, что они легко смогут определять голос конкретного человека и вести список тех, кто обладает доступом к устройству.
Также их беспокоит, что умные устройства (голосовые помощники) зачастую беспроблемно могут попадать в руки детей, которые по незнанию способны делать очень крупные покупки, создавая тем самым проблемы для своих родителей. Указанные инциденты стали настолько частыми, что многочисленные крупные розничные торговцы запустили программы для возврата денег за товары, заказанные маленькими детьми. Например, подобная ситуация произошла в г. Далласе, штате Техас (США), когда шестилетний ребенок попросил у умного динамика «Amazon Echo» приобрести кукольный домик и пару фунтов сладкого печенья. Помощник, не делающий различий между голосами и ответами по имени «Алекс», очень оперативно выполнил детскую просьбу, закупив одну из наиболее дорогих моделей.
Сложившиеся проблемы увидели и некоторые компании и незамедлительно воспользовались ими. Они начали применять разные уязвимости в голосовых помощниках, не распознающих голосовые особенности владельца, в собственных корыстных целях. К примеру, одной из компаний был запущен рекламный ролик, в котором произносится поисковый запрос, активирующий систему динамиков «Google Home». Таким образом, «умные» колонки интернет-пользователей срабатывали и, невзирая на отсутствие желания их владельцев, открывали в «Википедии» статью, которая посвящена продукции указанного в запросе ресторана. Необходимо отметить и тот факт, что компания «Google» устранила последствия агрессивной рекламной кампании, и сейчас колонки не реагируют на такие маневры. Тем не менее, очень высокий риск повторения вирусных кампаний в будущем не исключается.
Соответственно, голосовые помощники, многие пользователи сейчас характеризуют, как самый настоящий кошмар для конфиденциальности, поскольку такими системами с каждым годом обрабатывается все больше и больше информации из повседневной жизни каждого пользователя. Однако на рейтинг продаж подобное пользовательское отношение если и повлияло, то очень незначительно. Современные голосовые пользователи бьют все рекорды популярности, многие пользователи считают их наличие не только удобным, но и перспективным, очень престижным. [11]
Сегодня активно прорабатывается внедрение систем, основанных на общении с визуальным интерфейсом. Огромным преимуществом визуальных интерфейсов является то, что варианты взаимодействия видны. В голосовом интерфейсе пользователь не знает, что именно доступно. Взаимодействие с экранами является очень хорошо разработанной темой. Экран останется даже при хорошей работе голосового интерфейса хотя бы потому, что у человека есть глаза и визуальное восприятие представляется основным форматом, а голос относится к вспомогательным нюансам. Голос человека способен взаимодействовать с отображением данных на экране, не являясь при этом подчиненной структурой. К примеру, в «Alexa» основной компонент сегодня представлен именно голосом. Пользователь может поставить приложение, чтобы увидеть все ответы системы на экране, если некоторые ответы трудно услышать. Правда, сейчас концепция меняется, поэтому в следующей версии «Amazon Echo» предполагает применять ультрасовременный экран.
Существуют и иные проблемы, напрямую взаимосвязанные сегодня с голосовыми помощниками. Ими может сохраняться больше информации, чем предварительно было запланировано. Помощники должны записывать звуковую дорожку исключительно после того, как они услышат кодовые сигнал от владельца. Однако, зачастую срабатывание происходит при созвучных словах или от работающего телевизора, музыкального проигрывателя, простой разговорной речи, используемой в обиходе.
Кроме прочего, сотрудники в компаниях-разработчиках вполне могут получать доступ к личной, персональной информации любого пользователя.
Это связано с тем, что люди почти «полностью» доверяются новым информационным технологиям в Интернете, не задумываются о личной информационной безопасности и как результат, зачастую не проверяют качество работы голосовых помощников, а они, в свою очередь способны обнаруживать и транслировать сугубо личную информацию, включая историю болезни.
По данным экспертов, компания «The Guardian» внесла специальные изменения в свою собственную программу для контроля качества разработанного голосового помощника «Siri». Согласно этим новым правилам, сотрудники больше не смогут услышать любые голосовые команды, отправленные пользователями «Siri» без наличия на это согласия со стороны самого пользователя.
И такие опасения и изменения не напрасны. В современных реалиях злоумышленники способны достаточно легко воспользоваться персональными данными пользователя. Как и любая другая информация, собираемая компаниями, голосовые записи подвержены риску активно применяемых в современных условиях хакерских атак. Их можно использовать с целью имитации голоса пользователя и взлома его учетных записей, казалось бы, максимально надежно защищенных биометрическими данными. В некоторых случаях в указанных атаках может и не быть острой необходимости. К примеру, известен случай, когда пользователь «Amazon» по чистой случайности получил более полутора тысяч аудиозаписей совсем незнакомого ему человека после запроса файла с его данными.
Неоспоримым является и тот факт, что в современных условиях вполне могут возникать разнообразные конфликты интересов. Так, компании собирают личные данные пользователей, чтобы как можно лучше решать проблемы клиентов. Однако, абсолютно любая собираемая персональная информация может использоваться компаниями не только для себя, но и с целью выгоды определенных партнеров. [12]
По данным экспертов, некоторые сотрудники из крупных компаний разработчиков голосовых помощников, зная определенные коды и технологию работы систем способны узнавать, откуда были совершены звонки на голосовое помощники, и в самые кратчайшие сроки вычислять домашний адрес такого пользователя и другие необходимые (доступные) сведения.
Предполагается, что в самом ближайшем будущем текущий уровень ошибок должен уменьшиться на порядок благодаря новейшим моделям для машинного обучения. Вполне возможно, что у каждого пользователя в обозримом будущем будет свой собственный персональный голосовой помощник с нужным ему голосом.
Внедрение и распространение новейших голосовых интерфейсов происходит чрезвычайно быстро, и скоро, вероятно, можно будет увидеть чудесные персонализации, которые на сегодняшний день совершенно недоступны в условиях текстового поиска. При этом, еще считаю необходимым отметить, что несмотря на то, что голосовые помощники (интерфейсы) сегодня довольно хорошо развиты, но технология еще не достигла своего предела. В ближайшие годы она будет развиваться в разных направлениях. Новые голосовые помощники достаточно скоро найдут «собственное лицо», которое расширит их потенциальные возможности.
В заключение необходимо отметить, что как показывает практика последних лет, многие отечественные и зарубежные IT-компании, разрабатывающие голосовых помощников, уже вступили в так называемую «гонку вооружений». Несомненно, эта борьба позволит победителям получить потрясающий набор информации, который в последствие сможет стать бесконечным источником для обеспечения не только конкурентного преимущества, но и очень солидного дохода.
И в этой связи, считаю целесообразным сказать: «Подумайте о своей личной информационной безопасности!»
Литература:
- Всероссийский конгресс молодых ученых (Санкт-Петербург). Сборник трудов VIII Конгресса молодых ученых / Министерство науки и высшего образования Российской Федерации, Университет ИТМО. — Санкт-Петербург: Университет ИТМО, 2019. Т. 3. — 2019. — 371 с.
- Шаг в будущее: искусственный интеллект и цифровая экономика: Smart Nations: экономика цифрового равенства: материалы III Международного научного форума / Министерство науки и высшего образования Российской Федерации, Федеральное государственное бюджетное образовательное учреждение высшего образования «Государственный университет управления»; под общей редакцией П. В. Терелянского, С. М. Малкаровой. — Москва: ГУУ, 2020-. Вып. 1. — 2020. 360 с.
- Экономика. Право. Инновации. 2020. 2020, № 4. — 2020. — 106 с.
- Поначугин А. В., Пичужкина Д. Ю., Смекалова Е. С. «Голосовой помощник как технология обработки данных» Наука без границ. 2020. № 6 (46). [электронный портал] URL:https://cyberleninka.ru/article/n/golosovoy-pomoschnik-kak-tehnologiya-obrabotki-dannyh (дата обращения: 17.03.2021).
- Управление персоналом, социальными и бизнес-коммуникациями: методы, модели, технологии: материалы Всероссийской научно-практической конференции / Министерство науки и высшего образования Российской Федерации, Федеральное государственное бюджетное образовательное учреждение высшего образования «Государственный университет управления»; [редакционная коллегия: Екимова К. В. [и др.]. — Москва: Издательский дом ГУУ, 2019. — 171 с.
- Марр, Бернард. Искусственный интеллект на практике: 50 кейсов успешных компаний: [16+] / Бернард Марр, Мэтт Уорд; перевод с английского Екатерины Петровой. — Москва: Манн, Иванов и Фербер, 2020. — 316 с.
- Ахмаева Л. Г. Пользовательский опыт и возможности использования голосовых ассистентов в интерактивных маркетинговых коммуникациях: Amazon Alexa, Google home, Apple Siri, Яндекс Алиса // Вестник ГУУ. 2020. № 5. [электронный портал] URL:https://cyberleninka.ru/article/n/polzovatelskiy-opyt-i-vozmozhnosti-ispolzovaniya-golosovyh-assistentov-v-interaktivnyh-marketingovyh-kommunikatsiyah-amazon-alexa (дата обращения: 17.03.2021).
- Воронежский государственный университет. Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии «Proceedings of Voronezh state university. Series: Systems analysis and information technologies»: научный журнал / учредитель и издатель: Федеральное государственное бюджетное образовательное учреждение высшего образования «Воронежский государственный университет». — Воронеж: Воронежский гос. ун-т, 2006-.2020, № 1. — 2020. — 178 с.
- Технологические тренды и модели цифровой трансформации экономики: монография / Малявкина Л. И., Савина А. Г., Сергеева И. И. [др.]; под редакцией д. э.н. профессора Малявкиной Л. И.; Министерство высшего образования и науки Российской Федерации, ФГБОУ ВО «Орловский государственный университет экономики и торговли». — Орел: ОрелГУЭТ, 2020. — 167 с.
- Информация и безопасность. 2020. 2020, Т. 23, № 3. — 2020. — [2], 324–469 с.
- Альманах научных работ молодых ученых / Министерство науки и высшего образования Российской Федерации, Университет ИТМО. — Санкт-Петербург: Университет ИТМО, 2019-. Т. 2. — 2019. — 174 с.
- Коротких, Татьяна Николаевна. Современные информационные технологии: учебное пособие по курсу «Современные проблемы информатики и вычислительной техники» для студентов, обучающихся по направлениям 09.04.01 — «Информатика и вычислительная техника» / Т. Н. Коротких, И. И. Коротких; Министерство науки и высшего образования Российской Федерации, Национальный исследовательский университет «МЭИ». Москва: Изд-во МЭИ, 2020. — 58 с.