Характеристические подходы при распознавании изображений | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 7 ноября, печатный экземпляр отправим 11 ноября.

Опубликовать статью в журнале

Автор:

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №50 (288) декабрь 2019 г.

Дата публикации: 13.12.2019

Статья просмотрена: 35 раз

Библиографическое описание:

Кураева, Е. С. Характеристические подходы при распознавании изображений / Е. С. Кураева. — Текст : непосредственный // Молодой ученый. — 2019. — № 50 (288). — С. 17-19. — URL: https://moluch.ru/archive/288/65129/ (дата обращения: 26.10.2020).



В данной работе рассматриваются характеристические методы идентификации. Они применяются в распознавании изображений, что является актуальным на сегодняшний день.

Ключевые слова: машинное зрение, распознавание, характеристический метод, сравнение с шаблоном, сравнение топологических графов, метод опорных векторов.

Как видит человек? Как он обрабатывает полученную информацию? Как он принимает решение о дальнейших действиях? Реальное изображение мира попадает на сетчатку глаза человека, происходит некий анализ: сначала информация попадает в зрительную кору головного мозга, где происходит более полный анализ, после информация распространяется в остальные отделы мозга, где происходит сравнение полученных данных и уже имеющихся, чтобы сделать вывод об увиденном. И только после всех этих этапов мозг принимает решение о дальнейших действиях. На основе человеческого организма реализован принцип машинного зрения.

Исследование машинного зрения началось еще в 50-х годах и продолжается до сих пор. Сейчас машина может распознать определенный объект. Но уже с другим предметом для нее возникнут трудности. Дело в том, что у человека кора головного мозга выполняет множество функций: чувства, восприятие... А также множество жизненных уроков, полученных из внешнего мира. На этом этапе остановилось развитие машинного зрения. Потому что тема работы человеческого мозга не исследована до конца.

Однако даже на данном этапе развития машинного зрения возможно, например, распознать эмоции человека, беспилотные автомобили могут считывать дорожные знаки, роботы в промышленности могут замечать некоторые проблемы производства.

Автоматическая локализация лица человека на изображении и последующая идентификация относятся к понятию распознавания лиц.

Наиболее актуальные на текущий момент системы распознавания лиц часто используют представление лиц в виде векторов в некотором линейном пространстве (embedding). Статьи с описаниями работы обучающих алгоритмов обычно концентрируют внимание на улучшении качества этого представления, но не дают конкретных советов по его использованию за пределами сравнения двух изображений — советов по выбору алгоритмов кластеризации таких векторов для задач распознавания.

Все методы распознавания лиц делятся на две основные категории: геометрические, или характеристические, где анализируются различные особенности лица по отдельности [3, с. 2] и целостные подходы, такие, как Eigenfaces и нейросети. В геометрическом подходе [4] мы сначала преобразовываем входное изображение, чтобы уменьшить влияние шумов, а затем выделяем из него характерные лицевые особенности, такие как глаза, нос, рост, и т. д., и вычисляем геометрические особенности их расположения, таким образом уменьшая размерность входного изображения до размерности вектора геометрических особенностей лица. Затем используются стандартные статистические подходы по распознаванию шаблонов, чтобы сравнить полученные вектор с хранящимися в базе. Данный подход наиболее распространён до начала 2010-х годов.

Характеристические подходы к распознаванию лиц можно поделить на несколько подтипов:

  1. Сравнение с шаблоном. Данный подход применим тогда, когда и обучающая выборка, и тестовый случай представлены не одним изображением, а целым набором, а иногда даже разнородными данными (фото и видео разного качества). Шаблон лица получают путём усреднения интенсивности пикселей, соответствующих одинаковым точкам лица, для чего изображения сначала стараются выровнять, используя различные алгоритмы. Оценку схожести двух наборов вычисляют либо как меру схожести их шаблонов [5, с. 15], либо путём попарного сравнения изображений, а затем усреднением по всем парам. Помимо усреднения интенсивностей более недавние работы предлагают усреднение других особенностей изображения, например, SIFT дескрипторов [6, с. 3]
  2. Сравнение топологических графов. Подход был вдохновлён открытием принципов работы клеток зрительных отделов коры млекопитающих. Многие из клеток специализируются на обнаружении простых структур, таких как углы или прямые линии, идущие под определённым углом. Запрограммированные людьми детекторы, такие как SIFT, SURF, фильтры Габора, используют в своей основе похожих функции. С их помощью на изображении осуществляется поиск ключевых точек лица — глаз, носа, рта и т. д. Затем полученный на их основе граф лица сравнивается с графами, хранящимися в базе, по определённому алгоритму Данный подход плохо справляется с перекрытием части лица, т. к. граф получается не полным. Сейчас метод на основе фильтров Габора широко используется для распознавания печатного текста. [7, с. 135].
  3. Метод опорных векторов. Данный метод схож с предыдущим в том, что для получения начальной информации используются рукописные фильтры, характеризующие особые точки изображения. Одна затем вместо топологического графа применяется метод SVM (Support Vector Machine). Метод SVM был изначально предложен в [5, с. 7] для решения задач классификации (что идентично задаче идентификации, если мы примем фото одного человека за класс), но затем расширен и применён для задач регрессии [6, с. 35] (количественного предсказания). Основная идея метода — перевод исходных векторов в пространство более высокой размерности и поиск разделяющей гиперплоскости с максимальным зазором в этом пространстве. Две параллельных гиперплоскости строятся по обеим сторонам гиперплоскости, разделяющей классы. Разделяющей гиперплоскостью будет гиперплоскость, максимизирующая расстояние до двух параллельных гиперплоскостей. Алгоритм работает в предположении, что чем больше разница или расстояние между этими параллельными гиперплоскостями, тем меньше будет средняя ошибка классификатора. Особым свойством метода опорных векторов является непрерывное уменьшение эмпирической ошибки классификации и увеличение зазора, поэтому метод также известен как метод классификатора с максимальным зазором.

Литература:

  1. FaceNet: A Unified Embedding for Face Recognition and Clustering // arXiv.org. URL: https://arxiv.org/abs/1503.03832 (дата обращения: 09.12.2019).
  2. Yaniv Taigman, Ming Yang, Marc'Aurelio Ranzato, Lior Wolf. DeepFace: Closing the Gap to Human-Level Performance in Face Verification // Conference on Computer Vision and Pattern Recognition (CVPR). — 2014. — № 978–1–4799–5118–5. — С. 2.
  3. G. Yongsheng and M. K. H. Leung, “Face recognition using line edge map”, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.24, C. 17.
  4. Manjunath, B., Chellappa, R. & von der Malsburg, C. (1992), «A Feature Based Approach to Face Recognition», IEEE Conference Proceedings on Computer Vision and Pattern Recognition.
  5. J. Hamm and D. D. Lee. Grassmann discriminant analysis: a unifying view on subspace-based learning. Int. Conf. Mach. Learning, стр. 376–383, 2008
  6. J. Dong and S. Soatto. Domain-size pooling in local descriptors: Dsp-sift. InProc. Conf. Comput. Vision Pattern Recognition, стр. 5097–5106, 2015.
  7. S Sabari Raju, Peeta Basa Pati and A G Ramakrishnan, “Gabor Filter Based Block Energy Analysis for Text extraction from Digital Document Images,” Proc. First International Workshop on Document Image Analysis for Libraries (DIAL-04), Palo Alto, USA, Jan. 2004, pp. 233–243.
Основные термины (генерируются автоматически): машинное зрение, SIFT, SVM, SURF, вектор, входное изображение, головной мозг, изображение, максимальный зазор, распознавание лиц.


Ключевые слова

распознавание, машинное зрение, характеристический метод, сравнение с шаблоном, сравнение топологических графов, метод опорных векторов

Похожие статьи

Анализ методов обнаружения лиц на изображении

Ключевые слова: обнаружение лиц, компьютерное зрение. Задача обнаружения лица на изображении часто является первым шагом в процессе решения задачи более высокого уровня — распознавания лица, деталей лица или его мимики.

Распознавание ключевых точек лица на изображении человека

Распознавание человека по изображению лица имеет ряд преимуществ по сравнению с. Обнаружение лица в кадре является достаточно

Ключевые слова: обнаружение, eye-tracker, изображение, машинное обучение. Задача обнаружения объекта на изображении является...

Исследование показателей качества и быстродействия поиска...

Примером служат задачи поиска изображений по базе данных, распознавания объектов на сцене, классификация изображений, оценка

Отдельной группой можно выделить методы (SURF, SIFT), которые сочетают в себе и поиск опорных точек, и формирование вектора...

Обзор методов распознавания изображений | Статья в сборнике...

Основная идея алгоритма заключается в том, что изображение может быть описано

Архитектура вдохновлена некоторыми особенностями коры головного мозга, в которой были

Классический подход — сложение векторов сигнала и памяти и вычисление активации от...

Алгоритмы распознавания объектов | Статья в сборнике...

В данной статье рассмотрены алгоритмы распознавания объектов на изображении, проведен анализ методов, применяемых при обработке изображений, а также описано использование средств машинного обучения в рамках работы с изображениями.

Методы нахождения особых точек изображения и их дескрипторов

Задача сопоставления изображений используется следующих целей

Разработка сервиса распознавания брендовых лейблов. SIFT Scale-invariant feature transform [2]

Основным разделом компьютерного зрения является извлечение информации из изображений или...

Обнаружение объектов на изображении с использованием...

Ключевые слова: обнаружение, eye-tracker, изображение, машинное обучение. Сбор данных для обучения модели АС осуществляется с помощью

Распознавание мобильных объектов на основе эвристических данных и машинного обучения. Камеры сгорания дизелей с двойным...

Методы определения объектов на изображении

В работе рассматриваются некоторые методы распознавания объектов на изображении, основанные на детекторах границ и каскадных классификаторах. Ключевые слова: компьютерное зрение, OpenCV, детектор границ, матрица свертки, оператор Собеля, детектор границ Канни...

Угрозы использования систем автоматического распознавания...

Уязвимость систем распознавания изображений (лиц) подтверждает исследование [4]. Потенциальная угроза заключается в том, что злоумышленник сможет, обманув систему распознавания лиц, выдать себя за вас, и совершить какую-либо операцию с вашим...

Похожие статьи

Анализ методов обнаружения лиц на изображении

Ключевые слова: обнаружение лиц, компьютерное зрение. Задача обнаружения лица на изображении часто является первым шагом в процессе решения задачи более высокого уровня — распознавания лица, деталей лица или его мимики.

Распознавание ключевых точек лица на изображении человека

Распознавание человека по изображению лица имеет ряд преимуществ по сравнению с. Обнаружение лица в кадре является достаточно

Ключевые слова: обнаружение, eye-tracker, изображение, машинное обучение. Задача обнаружения объекта на изображении является...

Исследование показателей качества и быстродействия поиска...

Примером служат задачи поиска изображений по базе данных, распознавания объектов на сцене, классификация изображений, оценка

Отдельной группой можно выделить методы (SURF, SIFT), которые сочетают в себе и поиск опорных точек, и формирование вектора...

Обзор методов распознавания изображений | Статья в сборнике...

Основная идея алгоритма заключается в том, что изображение может быть описано

Архитектура вдохновлена некоторыми особенностями коры головного мозга, в которой были

Классический подход — сложение векторов сигнала и памяти и вычисление активации от...

Алгоритмы распознавания объектов | Статья в сборнике...

В данной статье рассмотрены алгоритмы распознавания объектов на изображении, проведен анализ методов, применяемых при обработке изображений, а также описано использование средств машинного обучения в рамках работы с изображениями.

Методы нахождения особых точек изображения и их дескрипторов

Задача сопоставления изображений используется следующих целей

Разработка сервиса распознавания брендовых лейблов. SIFT Scale-invariant feature transform [2]

Основным разделом компьютерного зрения является извлечение информации из изображений или...

Обнаружение объектов на изображении с использованием...

Ключевые слова: обнаружение, eye-tracker, изображение, машинное обучение. Сбор данных для обучения модели АС осуществляется с помощью

Распознавание мобильных объектов на основе эвристических данных и машинного обучения. Камеры сгорания дизелей с двойным...

Методы определения объектов на изображении

В работе рассматриваются некоторые методы распознавания объектов на изображении, основанные на детекторах границ и каскадных классификаторах. Ключевые слова: компьютерное зрение, OpenCV, детектор границ, матрица свертки, оператор Собеля, детектор границ Канни...

Угрозы использования систем автоматического распознавания...

Уязвимость систем распознавания изображений (лиц) подтверждает исследование [4]. Потенциальная угроза заключается в том, что злоумышленник сможет, обманув систему распознавания лиц, выдать себя за вас, и совершить какую-либо операцию с вашим...

Задать вопрос