В настоящее время наблюдается высокий интерес к проблеме распознавания лиц. Под распознаванием будем понимать идентификацию изображения неизвестного лица с одной из известных персон. Распознавание человека по изображению лица имеет ряд преимуществ по сравнению с другими методами идентификации человека:
- Не требуется специальное и дорогостоящее оборудование для работы
- Не нужен физический контакт с устройством во время работы
Процесс распознавание личности на цифровой фотографии можно условно разбить на 2 этапа:
- Обнаружение лица в кадре
- Обработка и распознавание найденных лиц
Обнаружение лица в кадре является достаточно популярной темой. Большой вклад в нее сделал [1], показавший и наглядно объяснивший один из классических подходов решения этой задачи: классификатора, обученного с помощью Гистограмм Ориентированных Градиентов (HOG). В [2] был показан более точный метод поиска лица на изображении с помощью свёрточной нейронной сети(СНС). Этот подход требует больших вычислительных мощностей для обучения, но хорошо обученная модель имеет достаточно высокую точность в распознавании лиц с большим поворотом головы и с плохим освещением.
Вахид Каземи предложил подход обработки найденного лица на изображения в работе [3]. Подход основан на модификации методов активных моделей формы, с помощью которого мы центрируем и масштабируем изображение для улучшения распознавания личности.
В работе [4] описываются самый популярный метод распознавания лиц: нейронные сети глубокого обучения. Именно эти подходы позволяют достичь точности в 99,83 %, но для достижения подобной точности нужно собрать большую размеченную выборку и большие вычислительные мощности для обучения сети. В основном эти подходы получают кодировки неизвестных лиц, а для распознавания личности нужно сравнивать кодировку неизвестного лица и кодировки известных лиц из базы данных с помощью любого классификатора, например, классификатора по минимуму расстояния Евклида.
На данном графике показана зависимость точность от порога Евклидового расстояния. Оптимальное значение: 0,5.
Ниже приведены матрицы неточностей для идентификации человека с детектированием с помощью классификатора, обученного с помощью гистограммы ориентированных градиентов и свёрточной нейронной сети соответственно:
Анализируя эти матрицы неточностей, мы получаем итоговую сравнительную таблицу:
|
Распознавание споиском лица на основе СНС |
Распознавание споиском лица на основе СНС |
Полнота |
1 |
0,96875 |
Точность |
1 |
0,954545 |
F-мера |
1 |
0,961595 |
Время работы |
366,84с |
43,12с |
Литература:
- Triggs B., Dalal N. Histograms of Oriented Gradients for Human Detection // 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR’05)(CVPR). –– Vol. 01. –– 2005. –– 06. –– P. 886–893. –– Access mode: doi. ieeecomputersociety.org/10.1109/CVPR.2005.177.
- А. Калиновский И. Детектирование лиц с помощью свёрточной нейронной сети. –– Томск, Россия: Томский политехнический университет.
- One Millisecond Face Alignment with an Ensemble of Regression Trees // Vahid Kazemi and Josephine Sullivan 2014
- Deep Residual Learning for Image Recognition / Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun // CoRR. –– 2015. –– Vol. abs/1512.03385. –– 1512.03385.