Влияние масштабирования на распознавание объектов нейронной сетью ImageAI YOLOv3 | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 30 ноября, печатный экземпляр отправим 4 декабря.

Опубликовать статью в журнале

Автор:

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №22 (364) май 2021 г.

Дата публикации: 02.06.2021

Статья просмотрена: 530 раз

Библиографическое описание:

Чивонго, Верданд Емил Сигфрид. Влияние масштабирования на распознавание объектов нейронной сетью ImageAI YOLOv3 / Верданд Емил Сигфрид Чивонго. — Текст : непосредственный // Молодой ученый. — 2021. — № 22 (364). — С. 34-37. — URL: https://moluch.ru/archive/364/81704/ (дата обращения: 16.11.2024).



Исследовано влияние масштабирования изображения объекта на вероятность правильного распознавания нейронной сетью YOLOv3. Получена оценка минимально допустимого размера объекта на изображении.

Ключевые слова: нейронная сеть, распознавание, изображение, масштабирование.

Системы обнаружения малых беспилотных летательных аппаратов (БПЛА) [1] сейчас становятся важными системами безопасности. В таких системах кроме прочих датчиков могут быть применены видеокамеры и средства обработки видео. Для распознавания класса обнаруженного объекта (самолет/дрон/птица и т. д.) все более успешно применяют искусственные нейронные сети [2]. Однако в доступной литературе недостаточно информации по некоторым вопросам, актуальным для построения системы. Например, очень важно знать минимально допустимый размер объекта на изображении, при котором нейронная сеть еще способна правильно распознать этот объект. Поэтому целью данной работы была оценка минимально допустимого размера изображения объекта.

Исследование проводилось для нейронной сети с архитектурой YOLOv3 [3]. Она считается сейчас одной из самых быстрых и мало требовательных к ресурсам, что может облегчить ее использование во встраиваемых применениях. На сайте библиотеки ImageAI [4] существует ее предварительно обученная свободная реализация. Эта реализация обучена распознаванию 80 классов объектов, в том числе airplane (самолет) и bird (птица). Для экспериментов были выбраны несколько исходных изображений самолетов и созданы их масштабированные (уменьшенные) варианты с различными размерами, по 60 вариантов для каждого из исходных изображений. Для генерации таких наборов данных был создан плагин к графическому редактору GIMP. На рис. 1–3 приведены примеры масштабированных изображений.

Изображения из набора A1 с размерами объекта 190, 95, 48 пикселей

Рис. 1. Изображения из набора A1 с размерами объекта 190, 95, 48 пикселей

Изображения из набора A2 с размерами объекта 128, 64, 32 пикселей

Рис. 2. Изображения из набора A2 с размерами объекта 128, 64, 32 пикселей

Изображения из набора A3 с размерами объекта 152, 76, 38 пикселей

Рис. 3. Изображения из набора A3 с размерами объекта 152, 76, 38 пикселей

Нейронная сеть запускалась в облачной среде Google Colab. Результаты обработки этих наборов данных приведены на рис. 4–6.

Результаты распознавания набора A1

Рис. 4. Результаты распознавания набора A1

Результаты распознавания набора A2

Рис. 5. Результаты распознавания набора A2

Результаты распознавания набора A3

Рис. 6. Результаты распознавания набора A3

Видно, что вероятность правильного распознавания > 0,9 обеспечивается только если размер объекта на изображении превышает некоторое минимально допустимое значение порядка 25...40 пикселей (таблица 1).

Таблица 1

Минимальный размер объекта для нейронной сети ImageAI YOLOv3

Набор изображений

Минимальный размер объекта, пикселей

A1

40

A2

35

A3

25

Отсюда можно сделать вывод, что при разработке структуры системы обнаружения БПЛА нужно добиваться того, чтобы видеокамеры и блоки предварительной обработки передавали только такие изображения на вход нейронной сети, в которых обеспечивается не меньший размер объектов. В развитие данной работы предполагается исследовать влияние поворота изображения объекта.

Литература:

1. Макаренко С. И. Противодействие беспилотным летательным аппаратам. — СПб.: Наукоемкие технологии, 2020. — 204 c.

2. Samaras S. et al. Deep learning on multi sensor data for counter UAV applications—A systematic review //Sensors. — 2019. — Т. 19. — №. 22. — С. 4837.

3. Redmon J., Farhadi A. Yolov3: An incremental improvement. — Текст: электронный // arXiv: [сайт]. — URL: https://arxiv.org/pdf/1804.02767.pdf (дата обращения: 25.05.2021).

4. Official English Documentation for ImageAI!. — Текст: электронный // Moses Olafenwa and John Olafenwa: [сайт]. — URL: https://imageai.readthedocs.io/en/latest/ (дата обращения: 25.05.2021).

Основные термины (генерируются автоматически): нейронная сеть, изображение, результат распознавания набора, GIMP, допустимый размер, минимальный размер, набор данных, пиксель, правильное распознавание.


Похожие статьи

Влияние поворота изображения объекта на распознавание нейронной сетью ImageAI YOLOv3

Показано, что обученная реализация нейронной сети YOLOv3 на ресурсе ImageAI не обладает устойчивостью к поворотам изображения.

Процесс распознавания изображения нейронной сетью

В данной статье рассмотрены особенности распознавания изображения нейронной сетью.

Алгоритм обновления биометрического шаблона с применением нейронной сети

Биометрическое распознавание человека является очень актуальной темой в современном мире. Существует множество уникальных характеристик человека, по которым можно проводить распознавание. Такими характеристиками, например, являются лицо, радужная обо...

Влияние контраста и шума на распознавание изображений нейронной сетью YOLOv3

Показано, что для распознавания изображений с помощью нейронной сети YOLOv3 желательно поддерживать контраст не менее 0,3 и отношение сигнал/шум не ниже 15 дБ, иначе вероятность правильного распознавания может оказаться ниже 0,9.

Сравнение эффективности использования технологий CUDA и OpenCL при реализации нейронной сети репликации

В статье автор сравнивает эффективность технологий распараллеливания компьютерных вычислений на примере задачи реализации и обучения нейронной сети репликации.

Классификация изображений с помощью сверточных нейронных сетей

В статье автор исследует использование сверточных сетей для детектирования изображений.

Аспекты использования различных методов распознавания лиц в современных системах безопасности

В статье авторы стараются обозреть существующие аспекты использования различных методов распознавания лиц в современных системах безопасности.

Исследование эффективности гибридной нейросетевой архитектуры в контексте прогностического анализа энергопотребления в зданиях коммерческого назначения

Точное предсказание энергопотребления зданий играет важную роль в оптимизации планирования энергетических систем объектов. Энергопотребление зданий подвержено воздействию различных факторов и характеризуется как нелинейное, так и нестационарное явлен...

Исследование влияния перемещения объекта на изображении на корреляционные характеристики систем распознавания образов

В работе представлены математические выкладки по определению корреляционной характеристики от изменения параметров расположения объекта на изображении. Используется среда автоматизации математических вычислений MathCad. Приводятся структуры устройств...

Повышение эффективности размещения элементов БИС на основе алгоритмов машинного обучения

В данной статье рассматривается целесообразность применения возможностей современного искусственного интеллекта в сфере проектирования микросхем, представлен метод размещения элементов БИС с использованием глубокого обучения с подкреплением на графов...

Похожие статьи

Влияние поворота изображения объекта на распознавание нейронной сетью ImageAI YOLOv3

Показано, что обученная реализация нейронной сети YOLOv3 на ресурсе ImageAI не обладает устойчивостью к поворотам изображения.

Процесс распознавания изображения нейронной сетью

В данной статье рассмотрены особенности распознавания изображения нейронной сетью.

Алгоритм обновления биометрического шаблона с применением нейронной сети

Биометрическое распознавание человека является очень актуальной темой в современном мире. Существует множество уникальных характеристик человека, по которым можно проводить распознавание. Такими характеристиками, например, являются лицо, радужная обо...

Влияние контраста и шума на распознавание изображений нейронной сетью YOLOv3

Показано, что для распознавания изображений с помощью нейронной сети YOLOv3 желательно поддерживать контраст не менее 0,3 и отношение сигнал/шум не ниже 15 дБ, иначе вероятность правильного распознавания может оказаться ниже 0,9.

Сравнение эффективности использования технологий CUDA и OpenCL при реализации нейронной сети репликации

В статье автор сравнивает эффективность технологий распараллеливания компьютерных вычислений на примере задачи реализации и обучения нейронной сети репликации.

Классификация изображений с помощью сверточных нейронных сетей

В статье автор исследует использование сверточных сетей для детектирования изображений.

Аспекты использования различных методов распознавания лиц в современных системах безопасности

В статье авторы стараются обозреть существующие аспекты использования различных методов распознавания лиц в современных системах безопасности.

Исследование эффективности гибридной нейросетевой архитектуры в контексте прогностического анализа энергопотребления в зданиях коммерческого назначения

Точное предсказание энергопотребления зданий играет важную роль в оптимизации планирования энергетических систем объектов. Энергопотребление зданий подвержено воздействию различных факторов и характеризуется как нелинейное, так и нестационарное явлен...

Исследование влияния перемещения объекта на изображении на корреляционные характеристики систем распознавания образов

В работе представлены математические выкладки по определению корреляционной характеристики от изменения параметров расположения объекта на изображении. Используется среда автоматизации математических вычислений MathCad. Приводятся структуры устройств...

Повышение эффективности размещения элементов БИС на основе алгоритмов машинного обучения

В данной статье рассматривается целесообразность применения возможностей современного искусственного интеллекта в сфере проектирования микросхем, представлен метод размещения элементов БИС с использованием глубокого обучения с подкреплением на графов...

Задать вопрос