Безопасное хранение информации в современном мире представляется одной из важнейших задач информационной безопасности. Значимую роль в этом деле играет аутентификация пользователей. Одним из перспективных и современных способов защиты информации пользователей является голосовая аутентификация.
Голосовая аутентификация (распознавание по голосу) — один из методов биометрической аутентификации, при котором в качестве идентификатора выступает голос пользователя. Метод основан на определении по характеристикам речевого сигнала принадлежности данного речевого сигнала конкретному диктору.
В зависимости от системы распознавания, голос может быть измерен как пассивно, т. е. при естественном разговоре, так и активно, если пользователь должен произнести определенную фразу или кодовое слово.
Преимущества идентификации по голосу следуют из характеристик голоса: не отчуждаем от человека; не требует непосредственного контакта; не требует сложных технических устройств. Голос диктора, а как следствие и сам речевой сигнал уникален ввиду специфики физиологического строения его артикуляционного аппарата и специфики его речи. Это обусловливает интерес к нему как биометрическому объекту.
Технологически системы распознавания разделяются на системы индивидуального и коллективного пользования. При санкционировании, например, доступа к операционной системе или каким-либо данным в персональном компьютере, распознавание диктора выполняется непосредственно в этом компьютере. При удаленном доступе, например, по телефонному каналу или Интернету, распознавание может осуществляться на сервере с множественным доступом.
Система распознавания должна содержать образцы голосов пользователей. Для этого каждый пользователь регистрируется в системе, записав свой голос. Образец голоса пользователя подвергается обработке и формируется в модель, которая заносится в базу данных для будущего сравнения с идентификаторами дикторов.
Алгоритм регистрации пользователя можно описать следующим образом. Голос поступает на вход в виде сигнала, закодированного с использованием импульсно-кодовой модуляции. Образец голоса подвергается предварительной подготовке, которая может заключаться в удалении участков, не содержащих речь, а также обработке фильтрами, делающими сигнал более пригодным для дальнейшей обработки.
После предварительной обработки из образца голоса извлекаются признаки — информация, отражающая индивидуальные признаки голоса человека. Индивидуальные голосовые качества разных людей определяются целым рядом параметров, включающих анатомические, артикуляционные, возрастные, социальные характеристики, дефекты речи, а также различные сочетания этих параметров.
Далее на основе извлеченных признаков строится модель голоса пользователя. Модель представляет собой некоторую структуру, позволяющую при данных признаках, оценить степень сходства либо сразу принять решение. Чем именно является эта структура, определяется системой распознавания. База данных системы распознавания содержит образцы голосов легальных пользователей в виде моделей.
Задача системы распознавания по голосу — осуществить идентификацию диктора. Первыми действиями решения данной задачи аналогично регистрации пользователей являются предварительная обработка и извлечение признаков.
Далее признаки, извлеченные из предъявленного образца, прошедшего предварительную обработку, сравниваются с моделями всех зарегистрированных пользователей в системе пользователей, либо предварительно отобранных. Принятие решения заключатся в определении зарегистрированного пользователя, которым наиболее вероятно может являться диктор. Результат сравнивается с заданным порогом и выдает положительное или отрицательное решение о допуске.
Задачи распознавания — это информационные задачи, состоящие из двух этапов:
преобразование исходных данных к виду, удобному для распознавания;
собственно, распознавание (указание принадлежности объекта определенному классу).
Выполняя извлечение признаков, построение модели и принятие решения, система распознавания решает задачу распознавания образа. В зависимости от того, какие методы распознавания встроены в алгоритмы системы, можно выделить три класса систем распознавания: статистические системы, кластерные системы и нейронные системы.
Статистические системы при идентификации образа используют метод перебора. В этом случае производится сравнение с базой данных, где для каждого вида объектов представлены всевозможные модификации отображения. В случае распознавания по голосу голос измеряется активно, производится сравнение записи кодового слова с записями кодовых слов зарегистрированных пользователей.
Кластерные системы производят более глубокий анализ характеристик образа. Используются математические преобразования. В случае распознавания по голосу при извлечении признаков из образца голоса формируется вектор признаков. После чего производится сравнение вектора признаков с моделями зарегистрированных пользователей.
Нейронные системы используют искусственные нейронные сети (ИНС). Этот метод требует либо большого количества примеров задачи распознавания при обучении, либо специальной структуры нейронной сети, учитывающей специфику данной задачи. Тем не менее, его отличает более высокая эффективность и производительность.
Данное разделение на классы является условным, т. к. система распознавания может в своих алгоритмах использовать комбинацию методов. Например, система распознавания, результат идентификации которой основывается на использовании ИНС и дополнительном статистическом подходе.
Нами были рассмотрены особенности структуры системы идентификации по голосу, состоящей из двух этапов: регистрации пользователей, идентификации, которые основаны на извлечении признаков из поступающих образцов голоса. При регистрации выполняется построение модели пользователя, которая заносится в базу данных системы. При идентификации извлеченных признаков из образца диктора выполняется сравнение извлеченных признаков с моделями зарегистрированных пользователей. Результат сравнения определяется допуском/недопуском диктора.
Рассмотрев метод распознавания по голосу, можем сделать вывод, что данный способ защиты информационных данных возможно успешно интегрировать в современную информационную инфраструктуру в виде части глобального биометрического аутентификатора.
Литература:
- Биометрическая аутентификация: защита систем и конфиденциальность пользователей. [Электронный ресурс] // URL: https://www.osp.ru/os/2012/10/13033122 (дата обращения 17.06.18).
- Задорожный В. Обзор биометрических технологий [Электронный ресурс] // URL: http://www.bre.ru/security/20234.html (дата обращения 17.06.18).
- Распознавание по голосу/распознавание речи [Электронный ресурс] // URL: http://www.allbiometrics.ru/voice-recognition (дата обращения 17.06.18).