Использование нейросетевых технологий в задаче автоматического распознавания эмоций | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 25 января, печатный экземпляр отправим 29 января.

Опубликовать статью в журнале

Библиографическое описание:

Использование нейросетевых технологий в задаче автоматического распознавания эмоций / С. О. Целикова, Я. П. Горожанкин, А. О. Иванов [и др.]. — Текст : непосредственный // Молодой ученый. — 2019. — № 26 (264). — С. 59-61. — URL: https://moluch.ru/archive/264/61173/ (дата обращения: 16.01.2025).



В статье представлены основные этапы разработки системы автоматического распознавания лицевых эмоций на основе нейронных сетей. Описываемая система способна распознать шесть базовых типов эмоций (удивление, страх, отвращение, злость, радость, грусть) на статическом изображении.

Ключевые слова: распознавание эмоций, нейронные сети.

Задача автоматического распознавания лицевых эмоций является актуальной в наши дни, имеет большое количество применений в различных сферах человеческой деятельности и привлекает внимание исследователей со всего мира. Так, распознавание эмоциональных реакций может использоваться в маркетинге, для повышения общественной безопасности, для улучшения степени эффективности взаимодействия человека и компьютера. Ежегодно в рамках международной конференции ACM проводится соревнование “Emotions recognition in the wild”, в рамках которого участникам необходимо разрабатывать решения задач связанных с автоматическим распознаванием эмоций.

Обзор существующих подходов

Алгоритм работы большинства методов, используемых в рамках решения задачи распознавания лицевых эмоций, состоит из следующих этапов: сбор и предобработка данных, извлечение и выбор признаков, классификация и принятие решения.

При использовании некоторых современных методов машинного обучения, таких как глубокое обучение, на вход алгоритму подается само изображение, а не набор признаков: выбор признаков и дальнейшее определение преобладающей на снимке эмоции происходит непосредственно внутри нейронной сети. В других подходах извлечение признаков и последующая классификация являются отдельными, не связанными между собой задачами, каждая из которых может быть решена одним из возможных способов. Так, для извлечения признаков в подобных подходах могут использоваться такие методы как: Active Shape Model, Local Binary Pattern, вейвлеты Габора. Решение задачи классификации же может быть осуществлено с помощью метода опорных векторов, случайного леса и других.

В рассматриваемой системе решение задачи автоматического распознавания эмоций осуществляется сверточной нейронной сетью.

Обучающая выборка

При обучении нейронной сети применялись снимки из следующих датасетов: Fer2013 [1], CK+ [2], JAFFE [3].

Перед передачей данных нейронной сети для обучения, необходимо осуществить их предобработку. На первом этапе на снимках обучающей выборки с помощью метода Виолы-Джонса осуществляется детектирование лиц: изображения, на которых не найдено лицо, удаляются из набора данных, а оставшиеся обрезаются по области лица. Кроме того, из выборки удаляются искаженные и размытые изображения, а также снимки, на которых часть лица закрыта очками или руками. На следующем этапе выполняется масштабирование изображений и приведение их к единому размеру 64х64. Такой размер с одной стороны — не искажает изображения, а с другой — позволяет сети достаточно быстро обучаться. На последнем этапе ко всем снимкам применяется метод глобальной нормализации контраста, который преобразует изображение таким образом, чтобы значение контраста на нем было постоянным.

Нейронная сеть

Для решения задачи автоматического распознавания эмоций в рассматриваемой системе используется сверточная нейронная сеть. Это особая архитектура нейронных сетей, основным предназначением которой является эффективное распознавание образов.

В процессе разработки системы была выбрана следующая архитектура сети: нейронная сеть состоит из 6 сверточных слоев. После второго, четвертого и шестого сверточных слоев находятся слои пулинга с фильтром размера 2х2, обеспечивающие уплотнение карт признаков. Перед полносвязным расположен слой выравнивания, являющийся соединительным узлом между слоями. Для борьбы с переобучением при обучении нейронной сети применялись следующие методы: Dropout [4], L2-регуляризация. Кроме того, для ускорения обучения применялся метод батч-нормализации [5].

Последний слой имеет функцию активации softmax:

, где

Z — исходный вектор,

K — размерность исходного вектора.

Благодаря данной функции сеть возвращает распределение вероятностей по классам.

В качестве функции потерь использовалась перекрестная энтропия:. Функция определяет расстояние между распределениями вероятности на выходе нейронной сети и фактическим распределением меток.

Точность работы нейронной сети на тестовом наборе данных составила 82 %. Наилучшие результаты сеть демонстрирует при распознавании таких классов эмоций, как радость, удивление и злость: 98, 93, 85 процентов соответственно. Несколько хуже результаты при распознавании снимков с метками грусть, отвращение, страх: 77, 71, 65 процентов соответственно.

Литература:

  1. База фотографий fer2013 [Электронный ресурс]: URL: https://www.kaggle.com/c/challenges-in-representation-learning-facial-expressionrecognition-challenge/data (дата обращения 27.01.2019).
  2. Lucey, P., Cohn, J. F., Kanade, T., Saragih, J., Ambadar, Z., & Matthews, I. The Extended Cohn-Kanade Dataset (CK+): A complete expression dataset for action unit and emotion-specified expression. Proceedings of the Third International Workshop on CVPR for Human Communicative Behavior Analysis (CVPR4HB 2010), San Francisco, USA, 2010, P. 94–101
  3. M. J. Lyons, S. Akemastu, M. Kamachi, J. Gyoba. Coding Facial Expressions with Gabor Wavelets, 3rd IEEE International Conference on Automatic Face and Gesture Recognition, 1998, P. 200–205
  4. N. Srivastava, G. Hinton, A. Krizhevsky, I. Sutskever and R. Salakhutdinov. Dropout: A Simple Way to Prevent Neural Networks from Overfitting. Journal of Machine Learning Research, 2014.
  5. S. Ioffe, C. Szegedy. Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift. In International Conference on Machine Learning, pages, 2015.P. 448–456
Основные термины (генерируются автоматически): нейронная сеть, автоматическое распознавание эмоций, ACM, JAFFE, автоматическое распознавание, выбор признаков, извлечение признаков, исходный вектор, помощь метода, решение задачи.


Похожие статьи

Алгоритм обновления биометрического шаблона с применением нейронной сети

Биометрическое распознавание человека является очень актуальной темой в современном мире. Существует множество уникальных характеристик человека, по которым можно проводить распознавание. Такими характеристиками, например, являются лицо, радужная обо...

Алгоритм генерации музыкальных композиций с использованием интуитивного и эмоционального подходов

Работа посвящена исследованию и разработке методов и алгоритмов, которые автоматизируют и поддерживают процесс технического творчества, с точки зрения автоматического создания музыкальных композиций. Метод основан на совместном использовании основных...

Применение моделей машинного обучения для поддержки принятия врачебных решений

В статье автор исследует возможности применения моделей машинного обучения для поддержки врачебных решений при проведении медицинской диагностики по симптомам и фотоснимкам дерматологических заболеваний. Спроектированы и разработаны модели на основе ...

Аспекты использования различных методов распознавания лиц в современных системах безопасности

В статье авторы стараются обозреть существующие аспекты использования различных методов распознавания лиц в современных системах безопасности.

Процесс распознавания изображения нейронной сетью

В данной статье рассмотрены особенности распознавания изображения нейронной сетью.

Влияние цифровизации на когнитивную сферу у детей

В статье говорится о том, что дети с раннего возраста оказываются погруженными в виртуальную среду. Ведущим видом деятельности современных дошкольников является игра на цифровых устройствах. В традиционной игре ребёнок является создателем воображаемо...

Классификация изображений с помощью сверточных нейронных сетей

В статье автор исследует использование сверточных сетей для детектирования изображений.

Классификация аудиосигналов с помощью нейронных сетей

В статье дано краткое описание существующих подходов к классификации аудио сигналов с помощью нейронных сетей, приводятся ссылки на смежные исследования, описаны детали подготовки нейронной сети, а также проблемы, которые могут возникнуть в процессе ...

Исследование активности головного мозга методом вызванных потенциалов

В этой статье рассматривается определение вызванных потенциалов (ВП), их роль в нейрофизиологических исследованиях, а также описывается система «Генератор стимулов», которая была разработана для проведения экспериментов по изучению активности головно...

Применение нейрогаджетов в тренингах развития эмоционального интеллекта

В статье авторы пытаются оценить нейрогаджет как средство развития эмоционального интеллекта.

Похожие статьи

Алгоритм обновления биометрического шаблона с применением нейронной сети

Биометрическое распознавание человека является очень актуальной темой в современном мире. Существует множество уникальных характеристик человека, по которым можно проводить распознавание. Такими характеристиками, например, являются лицо, радужная обо...

Алгоритм генерации музыкальных композиций с использованием интуитивного и эмоционального подходов

Работа посвящена исследованию и разработке методов и алгоритмов, которые автоматизируют и поддерживают процесс технического творчества, с точки зрения автоматического создания музыкальных композиций. Метод основан на совместном использовании основных...

Применение моделей машинного обучения для поддержки принятия врачебных решений

В статье автор исследует возможности применения моделей машинного обучения для поддержки врачебных решений при проведении медицинской диагностики по симптомам и фотоснимкам дерматологических заболеваний. Спроектированы и разработаны модели на основе ...

Аспекты использования различных методов распознавания лиц в современных системах безопасности

В статье авторы стараются обозреть существующие аспекты использования различных методов распознавания лиц в современных системах безопасности.

Процесс распознавания изображения нейронной сетью

В данной статье рассмотрены особенности распознавания изображения нейронной сетью.

Влияние цифровизации на когнитивную сферу у детей

В статье говорится о том, что дети с раннего возраста оказываются погруженными в виртуальную среду. Ведущим видом деятельности современных дошкольников является игра на цифровых устройствах. В традиционной игре ребёнок является создателем воображаемо...

Классификация изображений с помощью сверточных нейронных сетей

В статье автор исследует использование сверточных сетей для детектирования изображений.

Классификация аудиосигналов с помощью нейронных сетей

В статье дано краткое описание существующих подходов к классификации аудио сигналов с помощью нейронных сетей, приводятся ссылки на смежные исследования, описаны детали подготовки нейронной сети, а также проблемы, которые могут возникнуть в процессе ...

Исследование активности головного мозга методом вызванных потенциалов

В этой статье рассматривается определение вызванных потенциалов (ВП), их роль в нейрофизиологических исследованиях, а также описывается система «Генератор стимулов», которая была разработана для проведения экспериментов по изучению активности головно...

Применение нейрогаджетов в тренингах развития эмоционального интеллекта

В статье авторы пытаются оценить нейрогаджет как средство развития эмоционального интеллекта.

Задать вопрос