Использование нейросетевых технологий в задаче автоматического распознавания эмоций | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 4 мая, печатный экземпляр отправим 8 мая.

Опубликовать статью в журнале

Библиографическое описание:

Использование нейросетевых технологий в задаче автоматического распознавания эмоций / С. О. Целикова, Я. П. Горожанкин, А. О. Иванов [и др.]. — Текст : непосредственный // Молодой ученый. — 2019. — № 26 (264). — С. 59-61. — URL: https://moluch.ru/archive/264/61173/ (дата обращения: 20.04.2024).



В статье представлены основные этапы разработки системы автоматического распознавания лицевых эмоций на основе нейронных сетей. Описываемая система способна распознать шесть базовых типов эмоций (удивление, страх, отвращение, злость, радость, грусть) на статическом изображении.

Ключевые слова: распознавание эмоций, нейронные сети.

Задача автоматического распознавания лицевых эмоций является актуальной в наши дни, имеет большое количество применений в различных сферах человеческой деятельности и привлекает внимание исследователей со всего мира. Так, распознавание эмоциональных реакций может использоваться в маркетинге, для повышения общественной безопасности, для улучшения степени эффективности взаимодействия человека и компьютера. Ежегодно в рамках международной конференции ACM проводится соревнование “Emotions recognition in the wild”, в рамках которого участникам необходимо разрабатывать решения задач связанных с автоматическим распознаванием эмоций.

Обзор существующих подходов

Алгоритм работы большинства методов, используемых в рамках решения задачи распознавания лицевых эмоций, состоит из следующих этапов: сбор и предобработка данных, извлечение и выбор признаков, классификация и принятие решения.

При использовании некоторых современных методов машинного обучения, таких как глубокое обучение, на вход алгоритму подается само изображение, а не набор признаков: выбор признаков и дальнейшее определение преобладающей на снимке эмоции происходит непосредственно внутри нейронной сети. В других подходах извлечение признаков и последующая классификация являются отдельными, не связанными между собой задачами, каждая из которых может быть решена одним из возможных способов. Так, для извлечения признаков в подобных подходах могут использоваться такие методы как: Active Shape Model, Local Binary Pattern, вейвлеты Габора. Решение задачи классификации же может быть осуществлено с помощью метода опорных векторов, случайного леса и других.

В рассматриваемой системе решение задачи автоматического распознавания эмоций осуществляется сверточной нейронной сетью.

Обучающая выборка

При обучении нейронной сети применялись снимки из следующих датасетов: Fer2013 [1], CK+ [2], JAFFE [3].

Перед передачей данных нейронной сети для обучения, необходимо осуществить их предобработку. На первом этапе на снимках обучающей выборки с помощью метода Виолы-Джонса осуществляется детектирование лиц: изображения, на которых не найдено лицо, удаляются из набора данных, а оставшиеся обрезаются по области лица. Кроме того, из выборки удаляются искаженные и размытые изображения, а также снимки, на которых часть лица закрыта очками или руками. На следующем этапе выполняется масштабирование изображений и приведение их к единому размеру 64х64. Такой размер с одной стороны — не искажает изображения, а с другой — позволяет сети достаточно быстро обучаться. На последнем этапе ко всем снимкам применяется метод глобальной нормализации контраста, который преобразует изображение таким образом, чтобы значение контраста на нем было постоянным.

Нейронная сеть

Для решения задачи автоматического распознавания эмоций в рассматриваемой системе используется сверточная нейронная сеть. Это особая архитектура нейронных сетей, основным предназначением которой является эффективное распознавание образов.

В процессе разработки системы была выбрана следующая архитектура сети: нейронная сеть состоит из 6 сверточных слоев. После второго, четвертого и шестого сверточных слоев находятся слои пулинга с фильтром размера 2х2, обеспечивающие уплотнение карт признаков. Перед полносвязным расположен слой выравнивания, являющийся соединительным узлом между слоями. Для борьбы с переобучением при обучении нейронной сети применялись следующие методы: Dropout [4], L2-регуляризация. Кроме того, для ускорения обучения применялся метод батч-нормализации [5].

Последний слой имеет функцию активации softmax:

, где

Z — исходный вектор,

K — размерность исходного вектора.

Благодаря данной функции сеть возвращает распределение вероятностей по классам.

В качестве функции потерь использовалась перекрестная энтропия:. Функция определяет расстояние между распределениями вероятности на выходе нейронной сети и фактическим распределением меток.

Точность работы нейронной сети на тестовом наборе данных составила 82 %. Наилучшие результаты сеть демонстрирует при распознавании таких классов эмоций, как радость, удивление и злость: 98, 93, 85 процентов соответственно. Несколько хуже результаты при распознавании снимков с метками грусть, отвращение, страх: 77, 71, 65 процентов соответственно.

Литература:

  1. База фотографий fer2013 [Электронный ресурс]: URL: https://www.kaggle.com/c/challenges-in-representation-learning-facial-expressionrecognition-challenge/data (дата обращения 27.01.2019).
  2. Lucey, P., Cohn, J. F., Kanade, T., Saragih, J., Ambadar, Z., & Matthews, I. The Extended Cohn-Kanade Dataset (CK+): A complete expression dataset for action unit and emotion-specified expression. Proceedings of the Third International Workshop on CVPR for Human Communicative Behavior Analysis (CVPR4HB 2010), San Francisco, USA, 2010, P. 94–101
  3. M. J. Lyons, S. Akemastu, M. Kamachi, J. Gyoba. Coding Facial Expressions with Gabor Wavelets, 3rd IEEE International Conference on Automatic Face and Gesture Recognition, 1998, P. 200–205
  4. N. Srivastava, G. Hinton, A. Krizhevsky, I. Sutskever and R. Salakhutdinov. Dropout: A Simple Way to Prevent Neural Networks from Overfitting. Journal of Machine Learning Research, 2014.
  5. S. Ioffe, C. Szegedy. Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift. In International Conference on Machine Learning, pages, 2015.P. 448–456
Основные термины (генерируются автоматически): нейронная сеть, автоматическое распознавание эмоций, ACM, JAFFE, автоматическое распознавание, выбор признаков, извлечение признаков, исходный вектор, помощь метода, решение задачи.


Похожие статьи

Распознавание речи на основе искусственных нейронных сетей

При обучении нейронной сети распознаванию одного числа, например 5, желаемый выход

Каждая хромосома (нейронная сеть) представляет собой вектор из весовых коэффициентов.

В результате проделанной работы предложена модель распознавания речи на основе...

Анализ методов распознавания образов | Статья в журнале...

Таким образом, вся задача распознавания сводится к выделению существенных признаков для каждого класса и, в конечном итоге, отнесение входных данных к одному из них посредством обнаружения ключевых признаков в исходном изображении. То есть распознавание образов...

Алгоритмы распознавания объектов | Статья в сборнике...

Для решения задач, связанных с распознаванием удобно использовать достаточно простые алгоритмы получения признаков, к примеру, использование алгоритмов распознавания на основе примитивов Хаара. Примитивы Хаара представляют собой результат сравнения яркости...

Применение нейронных сетей в распознавании рукописного...

Нейронные сети — это раздел искусственного интеллекта, в котором для обработки сигналов

Приведенные методы обучения сети допускают, что известны только входные векторы, а на

Попова В. В. Распознавание рукописного текста на китайском языке на основе ключей при...

Математическое моделирование систем распознавания...

Формулировка задачи распознавания символов. Задача распознавания букв. Формулировка для нейронной сети.

Дано множество M объектов ω. Объекты задаются значениями некоторых признаков , наборы которых одинаковы для всех объектов.

Распознавание английского текста сверточной нейронной сетью

Математическая модель сверточной нейронной сети. Для описания математической модели рассматриваемой нейронной сети будем использовать

Рис. 2. Фильтры первого слоя сети, настроенные на распознавание простейших признаков. Размер выходных карт признаков...

Использование преобразования Гильберта-Хуанга для...

В качестве признаков для нейронной сети выбирался вектор энергий сегментов преобразования Фурье. При использовании вейвлет-преобразования для формирования признаков, описывающих речевой сигнал, необходимо определить число уровней детализации...

Анализ методов обнаружения лиц на изображении

- метод характерных инвариантных признаков; - распознавание с помощью шаблонов

На сегодняшний день метод искусственных нейронных сетей является наиболее

Система обучения и выбора наиболее значимых признаков полностью автоматизирована и не требует...

Методы распознавания образов | Статья в журнале...

Все методы распознавания объектов делятся на два вида: методы, основанные на теории решений и структурные методы.

На практике широкое применение имеют три формы представления признаков: вектор признаков (для количественных величин), символьная...

Похожие статьи

Распознавание речи на основе искусственных нейронных сетей

При обучении нейронной сети распознаванию одного числа, например 5, желаемый выход

Каждая хромосома (нейронная сеть) представляет собой вектор из весовых коэффициентов.

В результате проделанной работы предложена модель распознавания речи на основе...

Анализ методов распознавания образов | Статья в журнале...

Таким образом, вся задача распознавания сводится к выделению существенных признаков для каждого класса и, в конечном итоге, отнесение входных данных к одному из них посредством обнаружения ключевых признаков в исходном изображении. То есть распознавание образов...

Алгоритмы распознавания объектов | Статья в сборнике...

Для решения задач, связанных с распознаванием удобно использовать достаточно простые алгоритмы получения признаков, к примеру, использование алгоритмов распознавания на основе примитивов Хаара. Примитивы Хаара представляют собой результат сравнения яркости...

Применение нейронных сетей в распознавании рукописного...

Нейронные сети — это раздел искусственного интеллекта, в котором для обработки сигналов

Приведенные методы обучения сети допускают, что известны только входные векторы, а на

Попова В. В. Распознавание рукописного текста на китайском языке на основе ключей при...

Математическое моделирование систем распознавания...

Формулировка задачи распознавания символов. Задача распознавания букв. Формулировка для нейронной сети.

Дано множество M объектов ω. Объекты задаются значениями некоторых признаков , наборы которых одинаковы для всех объектов.

Распознавание английского текста сверточной нейронной сетью

Математическая модель сверточной нейронной сети. Для описания математической модели рассматриваемой нейронной сети будем использовать

Рис. 2. Фильтры первого слоя сети, настроенные на распознавание простейших признаков. Размер выходных карт признаков...

Использование преобразования Гильберта-Хуанга для...

В качестве признаков для нейронной сети выбирался вектор энергий сегментов преобразования Фурье. При использовании вейвлет-преобразования для формирования признаков, описывающих речевой сигнал, необходимо определить число уровней детализации...

Анализ методов обнаружения лиц на изображении

- метод характерных инвариантных признаков; - распознавание с помощью шаблонов

На сегодняшний день метод искусственных нейронных сетей является наиболее

Система обучения и выбора наиболее значимых признаков полностью автоматизирована и не требует...

Методы распознавания образов | Статья в журнале...

Все методы распознавания объектов делятся на два вида: методы, основанные на теории решений и структурные методы.

На практике широкое применение имеют три формы представления признаков: вектор признаков (для количественных величин), символьная...

Задать вопрос