Разработка модуля голосовой идентификации пользователя | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 28 декабря, печатный экземпляр отправим 1 января.

Опубликовать статью в журнале

Автор:

Научный руководитель:

Рубрика: Технические науки

Опубликовано в Молодой учёный №43 (438) октябрь 2022 г.

Дата публикации: 27.10.2022

Статья просмотрена: 72 раза

Библиографическое описание:

Рзаева, Г. М. Разработка модуля голосовой идентификации пользователя / Г. М. Рзаева. — Текст : непосредственный // Молодой ученый. — 2022. — № 43 (438). — С. 18-20. — URL: https://moluch.ru/archive/438/95330/ (дата обращения: 16.12.2024).



В работе описывается возможность применения и улучшения задачи разработки программного обеспечения при использовании средств голосового интерфейса и технологий распознания речи, а также цели и задачи будущей магистерской диссертации.

Ключевые слова : голосовой интерфейс, распознавание речи, разработка программного обеспечения.

Идентификация диктора — процесс, выявляющий личность по образцу голоса путём сравнения данного образца с образцами, сохранёнными в базе. Результатом процесса идентификации является список кандидатов. Выполняющая система может выдать список фиксированного размера либо приять решение о включении пользователя в список кандидатов на основании заданного критерия. Если предусмотрена возможность того, что в процессе идентификации участвует пользователь, не зарегистрированный в системе, то говорят об идентификации на открытом множестве. Если все пользователи, которые проходят процедуру идентификации, зарегистрированы в системе, то говорят об идентификации на замкнутом множестве.

Создание интерфейсов, поддерживающих и предлагающих более эргономичные и естественные формы диалога между пользователями и компьютерной техникой, движется и ускоряется внедрением информационных технологий в след растущим потребностям профессиональной и повседневной деятельности человека.

В области информационных технологий (ИТ) средства взаимодействия пользователя с технической системой принято называть интерфейсом. Интерфейсы бывают разные и реализуются разными средствами и методами. Одной из важнейших задач разработки современных технических систем является обеспечение наиболее интуитивного и естественного интерфейса с пользователем, то есть современные компьютерные приложения ориентированы на пользователя.

Одной из естественных форм взаимодействия для человека является речь. Голосовой интерфейс может улучшить существующий пользовательский интерфейс — он обеспечивает более удобный и менее ограниченный способ взаимодействия человека с компьютером. Качественный голосовой интерфейс помогает преодолевать неприятие технологии пользователями, так как для его использования не нужно овладевать новыми навыками. Голосовой интерфейс качественным образом изменяет способ, а, следовательно, и эффективность взаимодействия пользователя с системой.

Дикторозaвисимая система предназначена для использования одним пользователем, в то время как дикторонезависимая система предназначена

для работы с разными дикторами. Дикторонезaвисимость — труднодостижимая цель, так как при обучении системы, она настраивается на параметры того диктора, на примере которого обучается. Частота ошибок распознавания таких систем обычно в 3–5 раз больше, чем частота ошибок дикторозaвисимых систем.

Целью работы является — разработка специализированных средств голосового интерфейса и применение технологий распознания речи для разработки программного обеспечения.

Для достижения цели сформулированы и поставлены следующие задачи:

– изучение текущего состояния голосовых интерфейсов и соответственно области распознавания речи;

– произвести анализ предметных областей, обозначить существующие проблемы, трудности и недостатки применения не специализированных средств голосового интерфейса;

– разработать концептуальную архитектуру системы;

– разработать прототип программной реализации системы, имеющую модульную архитектуру с возможностями интеграции, учитывая условия и современные тенденции отрасли информационных технологий;

– разработать базовый набор средств голосового интерфейса для разработки программного обеспечения.

Объектом исследования являются средства голосового интерфейса, технологии распознавания речи и задача разработки программного обеспечения.

Предмет исследования — возможность применения и улучшения задачи разработки программного обеспечения при использовании средств голосового интерфейса и технологий распознания речи.

Из доступных на рынке и в отрасли инструментов разработки программного обеспечения, по критериям доступности, наличия и полноты документации, условиям лицензирования и стоимости, были выбраны следующие инструменты и приведены их описание и основные особенности.

Simplified Wrapper and Interface Generator (SWIG) — свободный инструмент для связывания программ и библиотек написанных на C/C++ со скриптовыми языками, такими как Tcl, Perl, Python, Ruby, PHP или другими языками (Java, C#, Scheme или OcamlP). SWIG можно использовать, модифицировать и распространять практически без ограничений, для коммерческих и некоммерческих целей. Основная цель — достигнуть связи с минимальными усилиями. В файлы заголовка программы добавляется небольшое количество указаний, по которым SWIG генерирует исходный код для связывания C/C++ и нужного языка.

Qt Software Development Kit (SDK) включает в себя инструменты, необходимые для сборки десктопа, встроенных и мобильных приложений с Qt.

В качестве плaтформы для иccледовaний и рaзрaботки модуля голосовой идентификации дикторa был выбрaн пaкет MATLAB. Данный выбор объясняется следующим:

MATLAB — пaкет приклaдных прогрaмм для решения задач сложных техничеcких вычиcлений, а тaкже иcпользуемый в этом пaкете язык программировaния. MATLAB иcпользуют более 1 000 000 научных и инженерных рaботников, он рaботает на большинстве cовременных оперaционных cистем, включaя GNU/Linux, Mac OS, Solaris и Microsoft Windows.

Язык MATLAB является высокоуровневым интерпретируемым языком программирования, включающим основанные на матрицах структуры данных, широкий спектр функций, интегрированную среду разработки, объектно-ориентированные возможности и интерфейсы к программам, написанным на других языках программирования.

В пакет MATLAB входят различные интерфейсы для получения доступа к внешним подпрограммам, написанным на других языках программирования, данным, клиентам и серверам, общающимся через технологии Component Object Model или Dynamic Data Exchange, а также периферийным устройствам, которые взаимодействуют напрямую с MATLAB. Многие из этих возможностей известны под названием MATLAB API.

Система Matlab предоставляет мощный язык программирования, ориентированный на математические преобразования, который превосходит по возможности и скорости вычислений традиционные языки программирования.

Литература:

  1. Возможности по распознанию речи Силаев А. В. Орёл ГТУ, научный руководитель Абашин В. Г.
  2. Жожикашвили В. А. и др. Применение распознавания речи в автоматизированных системах массового обслуживания// Автоматизация и современные технологии, 2020, No11, с.
  3. Воэльо, Л. П. Построение систем машинного обучения на языке Python / Воэльо Л. П., Ричарт В. — 2-е изд.: пер. с англ. Слинкин А. А. — М.: ДМК Пресс, 2016–302 с.: ил.
  4. Винцюк Т. К. Анализ, распознавание и интерпретация речевых сигналов. Киев: Наукова думка, 2019.
  5. http://www.speechpro.ru/ — Центр речевых технологии.
  6. http://www.tiobe.com/index.php/content/paperinfo/tpci/index.html
Основные термины (генерируются автоматически): MATLAB, голосовой интерфейс, программное обеспечение, SWIG, система, технология распознания речи, язык программирования, API, GNU, PHP.


Похожие статьи

Анализ и перспективы развития систем автоматизированного проектирования в строительстве

В статье раскрывается многообразие систем автоматизированного проектирования в строительстве, показаны их возможности и определены ближайшие перспективы развития.

Разработка информационной системы корпоративного тестирования сотрудников со встроенным блоком графоаналитического представления результатов

В данной статье автор пытается создать прототип информационной системы тестирования корпоративных работников. Рассматриваются технологии для разработки и отладки информационных систем, а также способы построения архитектуры программного обеспечения.

Новые возможности САПР за счет применения решений в области имитации естественного освещения

В статье рассмотрены возможности расширения традиционных подходов к проектированию систем искусственного освещения с помощью систем автоматизированного проектирования (САПР) за счет применения некоторых разработок, относящихся к концепции имитации ес...

Разработка веб-сервиса для интерактивного создания чат-ботов

В статье рассмотрены роль и проблемы совершенствования веб-сервисов на основе создания и внедрения интерактивного конструктора чат-ботов, позволяющего существенно повысить качество и эффективность взаимодействия пользователей, не владеющих профессион...

Современные информационно-коммуникационные технологии в инженерном образовании

В работе содержится анализ применения современных информационных технологий при обучении студентов инженерного профиля.

Современное состояние подходов к синтезу наземных беспилотных транспортных средств и основные проблемы концепции «беспилотный автомобиль»

В статье анализируется современное концепции синтеза беспилотных транспортных средств в Российской Федерации, классификационные проблемы устройств машинного зрения, проблемы и перспективы внедрения беспилотных наземных транспортных средств в зависимо...

Проблемы применения современных информационных технологий в изучении грамматики английского языка в средней образовательной организации

В статье рассматривается вопрос модернизации учебного процесса при изучении грамматики английского языка. Автор приводит методику использования современных информационных технологий для решения задач английской грамматики. Актуальность выбранной темы...

Инновационные технологии и инструменты компьютерного моделирования в обучении информатике в школе

В данной статье будет рассмотрено применение инновационных технологий и инструментов компьютерного моделирования на уроках информатики в школе. Будут представлены примеры использования данных технологий, а также проведена оценка их преимуществ и недо...

Проектирование программного обеспечения на базе экспертной системы «Выявление психологических отклонений»

В статье представлены этапы разработки полноценной экспертной системы, которая посредством взаимодействия с пользователем определяет его текущее психологическое состояние.

Разработка методов распознавания лиц для систем видеонаблюдения

Статья посвящен исследованию методов биометрической идентификации человека и описанию разработки системы видеонаблюдения.

Похожие статьи

Анализ и перспективы развития систем автоматизированного проектирования в строительстве

В статье раскрывается многообразие систем автоматизированного проектирования в строительстве, показаны их возможности и определены ближайшие перспективы развития.

Разработка информационной системы корпоративного тестирования сотрудников со встроенным блоком графоаналитического представления результатов

В данной статье автор пытается создать прототип информационной системы тестирования корпоративных работников. Рассматриваются технологии для разработки и отладки информационных систем, а также способы построения архитектуры программного обеспечения.

Новые возможности САПР за счет применения решений в области имитации естественного освещения

В статье рассмотрены возможности расширения традиционных подходов к проектированию систем искусственного освещения с помощью систем автоматизированного проектирования (САПР) за счет применения некоторых разработок, относящихся к концепции имитации ес...

Разработка веб-сервиса для интерактивного создания чат-ботов

В статье рассмотрены роль и проблемы совершенствования веб-сервисов на основе создания и внедрения интерактивного конструктора чат-ботов, позволяющего существенно повысить качество и эффективность взаимодействия пользователей, не владеющих профессион...

Современные информационно-коммуникационные технологии в инженерном образовании

В работе содержится анализ применения современных информационных технологий при обучении студентов инженерного профиля.

Современное состояние подходов к синтезу наземных беспилотных транспортных средств и основные проблемы концепции «беспилотный автомобиль»

В статье анализируется современное концепции синтеза беспилотных транспортных средств в Российской Федерации, классификационные проблемы устройств машинного зрения, проблемы и перспективы внедрения беспилотных наземных транспортных средств в зависимо...

Проблемы применения современных информационных технологий в изучении грамматики английского языка в средней образовательной организации

В статье рассматривается вопрос модернизации учебного процесса при изучении грамматики английского языка. Автор приводит методику использования современных информационных технологий для решения задач английской грамматики. Актуальность выбранной темы...

Инновационные технологии и инструменты компьютерного моделирования в обучении информатике в школе

В данной статье будет рассмотрено применение инновационных технологий и инструментов компьютерного моделирования на уроках информатики в школе. Будут представлены примеры использования данных технологий, а также проведена оценка их преимуществ и недо...

Проектирование программного обеспечения на базе экспертной системы «Выявление психологических отклонений»

В статье представлены этапы разработки полноценной экспертной системы, которая посредством взаимодействия с пользователем определяет его текущее психологическое состояние.

Разработка методов распознавания лиц для систем видеонаблюдения

Статья посвящен исследованию методов биометрической идентификации человека и описанию разработки системы видеонаблюдения.

Задать вопрос