В статье проводится исследование трех моделей бинаурального восприятия, характеристик и демаскирующих признаков при бинауральном восприятии речевого сигнала, моделируются особенности бинаурального слуха с помощью применения языка разработки LabVIEW National Instruments, и их применение на акустической фазированной решетке на базе многофункционального модуля сбора данных.
Ключевые слова: бинауральное восприятие, демаскирование, речевой сигнал, порог слышимости, фазированная решетка, демаскирование, речевой сигнал, диаграмма направленности, корреляционный анализ
- Постановка задачи
Первичной задачей исследования является разработка программы в среде NI LabVIEW для определения границ применимости трех моделей бинаурального восприятия в азимутальной плоскости на основе теоретических данных. С помощью данной программы можно установить границы применимости всех трех моделей в условиях изменения различных данных (местоположение, частота, интенсивность и т. д.).
Вторичной задачей исследования является разработка программы в среде NI LabVIEW для спектрального анализа звуковых сигналов, поступающих на решетку акустической фазированной решетки, состоящей из восьми элементов, расположенных в одной плоскости нескольких микрофонов.
- Используемое оборудование ипрограммное обеспечение
Создание комплекса для решения поставленной задачи осуществлялось в среде программирования LabVIEW с модулями NI VISA, NI DAQmx [1]. В ходе реализации испытательного стенда был использован многофункциональный модуль сбора данных NI USB — 6210. Также была применена фазированная решетка с несколькими закрепленными на ней микрофонами.
На рисунке 4 приведена типовая система сбора данных (DAQ-система), которая дискретизирует сигналы, выполняет цифроаналоговые преобразования для генерации сигналов аналогового вывода, а также воспринимает сигналы цифрового ввода и формирует сигналы цифрового вывода.
Рис. 1. типовая DAQ-система
- Описание решения
Для определения границ применимости трех моделей бинаурального восприятиябыла создана программа в среде разработки LabVIEW, построенная на основе существующих теоретических сведениях о моделях бинаурального восприятия звука, ее листинг представлен на рисунке 4. Входными параметрами являются интенсивность источника звука, а также координаты трех точек: источник сигнала и два приемника. На основе математических формул [2], была рассчитана интенсивность звука двух приемников, рассчитанная, в зависимости от типа распространения волн (плоская или сферическая).
Рис. 2. Блок-диаграмма программы границ применимости трех моделей бинаурального восприятия
Рис. 3. Моделирование интенсивностной модели бинаурального восприятия
По итогам проведенных результатов получены следующие результаты: интенсивностная модель бинаурального восприятия работает при разностной интенсивности в 11 %; при увеличении уровня сигнала значительно снижался уровень посторонних шумов, а при демаскировании сигнала порог слышимости снижался на 3 дБ. Полученные данные нам необходимы при решении вторичной задачи.
В программе Adobe Audition были созданы и воспроизведены сигналы (тоновый сигнал на частотах 100, 500 и 2000 Гц, а также речевой сигнал с параметром normalize amplitude 60 %), данные о приеме которых фиксировались в программе, созданной в среде разработки NI LabVIEW. Осциллограммы используемых сигналов показаны на рисунках 4–7. Производилась запись и постобработка с помощью корреляционного анализа (рисунок 4).
Рис. 4. Блок-диаграмма проведения измерений
Рис. 5. Полученные осциллограммы для тонового сигнала с частотой 100Гц
Рис. 6. Полученные осциллограммы для тонового сигнала с частотой 500Гц
Рис. 7. Полученные осциллограммы для тонового сигнала с частотой 1000Гц
Рис. 8. Полученные осциллограммы для речевого сигнала
По итогам проведенных результатов получены следующие результаты: при увеличении количества приемников сигнала спектр становится более информативным, из него можно более точно определить местоположение источника звука, распределение его по частотам, уровень основных гармоник. Также значительно снижается влияние шумов. C помощью разработанной модели можно определить как меняется уровень звукового давления при разных расстояниях до источника звука. При средних расстояниях до источника звука 3–15 м приближение и удаление источника звука сопровождается изменением его интенсивности [3]. В данном случае на увеличение расстояния уровень звукового давления уменьшился на 6 дБ.
- Внедрение иего перспективы
Данный программно-аппаратный комплекс будет внедрен в МГТУ им. Н. Э. Баумана на кафедре ИУ10 в качестве лабораторно-обучающего стенда для проведения дальнейших исследований в области существующих моделей бинаурального восприятия.
Литература:
- http://www.ni.com/data-acquisition/ — раздел на сайте National Instruments
- Сапожков М. А. Электроакустика: Учебник для вузов. (Москва: Издательство «Связь», 1978)
- Вахитов Я. Ш. Слух и речь, Конспект лекций. 1973.