Использование библиотек Python для распознавания образов | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 11 мая, печатный экземпляр отправим 15 мая.

Опубликовать статью в журнале

Авторы: , ,

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №22 (469) июнь 2023 г.

Дата публикации: 04.06.2023

Статья просмотрена: 73 раза

Библиографическое описание:

Кимачук, И. В. Использование библиотек Python для распознавания образов / И. В. Кимачук, И. А. Самойлова, Е. А. Спирина. — Текст : непосредственный // Молодой ученый. — 2023. — № 22 (469). — С. 12-14. — URL: https://moluch.ru/archive/469/103563/ (дата обращения: 27.04.2024).



В настоящее время широко применяется язык программирования Python, который обладает потрясающими возможностями и широким набором инструментов для их использования: в задачах искусственного интеллекта, умного дома и в целом, нейронных сетей. Вместе с тем Python богат на библиотеки! Caleb Hattingh в своей книге «20 Python Libraries You Aren't Using (But Should) предупреждает, что «экосистема» Python обширна и перспективна как по масштабу, так и по глубине. Начинать в этом сумасшедшем лесу с открытым исходным кодом сложно, и даже людям с многолетним опытом все еще требуются постоянные усилия, чтобы идти в ногу с лучшими библиотеками и методами. Книга поможет изучить некоторые из менее известных библиотек и инструментов Python, включая сторонние модули и полезные инструменты в стандартной библиотеке, которые заслуживают большего внимания [1].

Распознавание лиц является актуальным направлением в современной науке и технологиях. Его преимущества заключаются в возможности достижения высокой точности и скорости идентификации, а также минимизации ошибок человеческого фактора.

В работе использована библиотека OpenCV c открытым исходным кодом, которая работает на многих платформах и которая позволяет загружать, обрабатывать и сохранять изображения в различных форматах. Целью исследования является разработка алгоритма распознавания лиц с использованием библиотеки OpenCV на Python. В связи с поставленной целью важно выделить следующие задачи: выбор используемых библиотек и инструментов; сбор и обработка данных; разработка и тестирование алгоритмов распознавания лиц; анализ результатов исследования.

Для структурирования информации об «известных лицах» используется база данных, представленная на рисунке 1.

Каталог проекта

Рис. 1. Каталог проекта

На рисунке 2 изображена база данных, содержащая информацию о людях, занесенных в базу: first_name, last_name, title, image_path.

База данных employees

Рис. 2. База данных employees

База данных используется для сбора информации об «известных лицах», такой как, индивидуальный номер, имя, фамилия, должность и наименование файла с фото необходимым для сравнения известного лица в последующей аутентификации. С помощью базы данных можно не только редактировать данные уже известных люде, но и удалять или создавать.

Алгоритмы распознавания образов из библиотеки OpenCV используются для определения местоположения и кодировки лиц на кадре, а затем для сопоставления обнаруженных лиц с известными из базы данных лиц (рисунок 3).

Фото известных лиц

Рис. 3. Фото известных лиц

Если обнаруживается соответствие, то имя известного лица выводится на кадре видеопотока в окне с помощью функций OpenCV для рисования прямоугольника и надписи. Результат работы программы показан на рисунке 4.

Результат работы программы, когда лицо известное и неизвестное Результат работы программы, когда лицо известное и неизвестное

Рис. 4. Результат работы программы, когда лицо известное и неизвестное

Тестирование алгоритмов на видео показало, что разработанная программа полностью отвечает поставленным задач, а данная методология исследования включает в себя все необходимые этапы для проведения исследования в области распознавания лиц с использованием библиотеки OpenCV на Python.

Результатом выполнения работы является программа, способная обнаруживать и распознавать лица в видеопотоке на основе сравнения с базой данных, что может быть использовано в различных областях, например, для управления доступом или для повышения безопасности на рабочем месте. Для повышения точности распознавания лиц может потребоваться доработка алгоритмов и использование более сложных моделей глубокого обучения. Также стоит учитывать, что наличие препятствий, таких как бороды, маски или солнцезащитные очки, может затруднить распознавание лиц.

Недостатком может быть невысокая скорость работы при большом количестве лиц, так как её алгоритм работает в последовательном режиме. Однако, существуют более сложные и эффективные алгоритмы обработки данных, которые могут быть использованы для повышения скорости работы таких программ. Можно отметить, что в данном коде продемонстрировано использование нескольких основных элементов Python, таких как работа с библиотекой OpenCV, файлами, обработка изображений, работа с базой данных и управление потоками вывода.

Литература:

  1. Caleb Hattingh. 20 Python Libraries You Aren't Using (But Should). Released August 2016 Publisher(s): O'Reilly Media, Inc.
Основные термины (генерируются автоматически): база данных, библиотека, известное лицо, использование библиотеки, лицо, открытый исходный код, распознавание лиц, результат работы программы.


Похожие статьи

Применение библиотеки AForge.NET и ее расширения...

В статье приводится описание библиотек Accord.NET Framework, AForge.NET, а также показаны возможности их компонентов. Представлены способы использования данных компонент для решения задачи распознавания лиц в режиме реального времени.

Реализация системы распознавания и отслеживания лиц

В данной работе представлено теоретическое описание и процесс разработки системы

В этой статье для детекции людей на изображении используется самая известная модель детекции

Для распознавания лиц на изображениях используется нейронная сеть RetinaFace.

Выделяя области, содержащие человеческие лица, мы оставляем все необходимое данные для...

Разработка методов распознавания лиц для систем...

Для реализации программы распознавания лиц была выбрана одна из наиболее

Описывая общий алгоритм работы программы с использованием данной комбинации алгоритмов

Рис 2. Результат разбиения фото на карту градиентов. Чтобы найти лицо на карте градиентов

Проектируемая систем — система видеонаблюдения с возможностью распознавания лиц.

Автоматизированный программно-аппаратный комплекс ввода...

На основе библиотек с открытым исходным кодом разработана программа

В работе над своим проектом я применял машинное обучение и компьютерное зрение.

Способность анализировать данные и запоминать — главный принцип машинного обучения.

CNN, нейронная сеть, открытый исходный код, компьютерное зрение, машинное обучение.

Язык программирования Python. Библиотеки Python

В результате разработчики тратят больше времени на размышления о проблеме, которую они пытаются решить, и меньше времени

Итак, вот 7 основных библиотек для программирования на Python

Она считается одной из лучших библиотек для работы со сложными данными.

Keras — открытая нейросетевая библиотека, написанная на языке Python.

Использование кодеков в подготовке исходных данных для...

Описана работа и анализ работы созданной прикладной программы, использующей набор

 В данной работе решается задача подготовки исходных данных (обучающей выборки) для

Xvid является основным конкурентом кодека DivX. Открытый и сходный код и бесплатное

Содержит библиотеки: с утилитами для работы с командной строкой; с медиаплеером; со...

Анализ методов обнаружения лиц на изображении

Рис. 8. Пример библиотеки лиц и «не лиц».

В результате своей работы алгоритм должен определить лица и их черты и пометить их — поиск осуществляется в активной области изображения

Понимание данных методов важно для решения различного рода задач.

Метод Виолы-Джонса (Viola-Jones) как основа для распознавания лиц: [Электронный ресурс].

Анализ сервисов, позволяющих осуществлять идентификацию...

В ходе работы были изучены практические особенности работы библиотеки.

Записываются 68 точек данных, которые представляют собой декартовы координаты.

Затем необходимо получить подписку Azure и создать ресурс распознавания лиц. Это необходимо для того, чтобы получить ключ и конечную точку для дальнейшей работы.

Программные продукты с использованием открытого исходного...

Ключевые слова: программы для ЭВМ и базы данных, открытый лицензионный договор, свободный

Основной целью создания Единого реестра российских программ для ЭВМ и баз данных

Такие платежи в пользу иностранных лиц, в том числе, включают в себя платежи за

3. Право модифицировать исходный код программы, копировать и распространять эту.

Похожие статьи

Применение библиотеки AForge.NET и ее расширения...

В статье приводится описание библиотек Accord.NET Framework, AForge.NET, а также показаны возможности их компонентов. Представлены способы использования данных компонент для решения задачи распознавания лиц в режиме реального времени.

Реализация системы распознавания и отслеживания лиц

В данной работе представлено теоретическое описание и процесс разработки системы

В этой статье для детекции людей на изображении используется самая известная модель детекции

Для распознавания лиц на изображениях используется нейронная сеть RetinaFace.

Выделяя области, содержащие человеческие лица, мы оставляем все необходимое данные для...

Разработка методов распознавания лиц для систем...

Для реализации программы распознавания лиц была выбрана одна из наиболее

Описывая общий алгоритм работы программы с использованием данной комбинации алгоритмов

Рис 2. Результат разбиения фото на карту градиентов. Чтобы найти лицо на карте градиентов

Проектируемая систем — система видеонаблюдения с возможностью распознавания лиц.

Автоматизированный программно-аппаратный комплекс ввода...

На основе библиотек с открытым исходным кодом разработана программа

В работе над своим проектом я применял машинное обучение и компьютерное зрение.

Способность анализировать данные и запоминать — главный принцип машинного обучения.

CNN, нейронная сеть, открытый исходный код, компьютерное зрение, машинное обучение.

Язык программирования Python. Библиотеки Python

В результате разработчики тратят больше времени на размышления о проблеме, которую они пытаются решить, и меньше времени

Итак, вот 7 основных библиотек для программирования на Python

Она считается одной из лучших библиотек для работы со сложными данными.

Keras — открытая нейросетевая библиотека, написанная на языке Python.

Использование кодеков в подготовке исходных данных для...

Описана работа и анализ работы созданной прикладной программы, использующей набор

 В данной работе решается задача подготовки исходных данных (обучающей выборки) для

Xvid является основным конкурентом кодека DivX. Открытый и сходный код и бесплатное

Содержит библиотеки: с утилитами для работы с командной строкой; с медиаплеером; со...

Анализ методов обнаружения лиц на изображении

Рис. 8. Пример библиотеки лиц и «не лиц».

В результате своей работы алгоритм должен определить лица и их черты и пометить их — поиск осуществляется в активной области изображения

Понимание данных методов важно для решения различного рода задач.

Метод Виолы-Джонса (Viola-Jones) как основа для распознавания лиц: [Электронный ресурс].

Анализ сервисов, позволяющих осуществлять идентификацию...

В ходе работы были изучены практические особенности работы библиотеки.

Записываются 68 точек данных, которые представляют собой декартовы координаты.

Затем необходимо получить подписку Azure и создать ресурс распознавания лиц. Это необходимо для того, чтобы получить ключ и конечную точку для дальнейшей работы.

Программные продукты с использованием открытого исходного...

Ключевые слова: программы для ЭВМ и базы данных, открытый лицензионный договор, свободный

Основной целью создания Единого реестра российских программ для ЭВМ и баз данных

Такие платежи в пользу иностранных лиц, в том числе, включают в себя платежи за

3. Право модифицировать исходный код программы, копировать и распространять эту.

Задать вопрос