Влияние поворота изображения объекта на распознавание нейронной сетью ImageAI YOLOv3 | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 11 мая, печатный экземпляр отправим 15 мая.

Опубликовать статью в журнале

Автор:

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №22 (364) май 2021 г.

Дата публикации: 02.06.2021

Статья просмотрена: 134 раза

Библиографическое описание:

Чивонго, Верданд Емил Сигфрид. Влияние поворота изображения объекта на распознавание нейронной сетью ImageAI YOLOv3 / Верданд Емил Сигфрид Чивонго. — Текст : непосредственный // Молодой ученый. — 2021. — № 22 (364). — С. 37-40. — URL: https://moluch.ru/archive/364/81705/ (дата обращения: 02.05.2024).



Показано, что обученная реализация нейронной сети YOLOv3 на ресурсе ImageAI не обладает устойчивостью к поворотам изображения.

Ключевые слова: нейронная сеть, распознавание, поворот изображения.

Искусственные нейронные сети в настоящее время применяются в самых различных областях, в том числе в системах обеспечения безопасности для распознавания объектов [1]. Нейронная сеть с архитектурой YOLOv3 [2] отличается высокой производительностью. Для исследования возможностей применения нейронных сетей можно использовать библиотеку с открытым исходным кодом ImageAI [3]. Ресурс ImageAI предоставляет также обученную реализацию YOLOv3.

Цель данной работы состояла в том, чтобы определить, насколько будут влиять повороты изображения объекта на вероятность его правильного распознавания нейронной сетью. Это важно во многих применениях, например, для систем обнаружения летательных аппаратов.

Для этого исследования были сформированы 9 наборов данных, каждый из которых содержал по 60 изображений одного и того же объекта с шагом поворота 6 градусов (примеры показаны на рис. 1–3). Нейронная сеть ImageAI YOLOv3 запускалась в облачной среде Google Colab и обрабатывала эти наборы данных.

Результаты обработки приведены на рис. 4–6. Рассмотрение диаграмм позволяет сделать следующие выводы.

Изображения набора A1 100 с углами поворота –36, 0 и +36 градусов

Рис. 1. Изображения набора A1 100 с углами поворота –36, 0 и +36 градусов

Изображения набора A2 100 с углами поворота –72, 0 и +48 градусов

Рис. 2. Изображения набора A2 100 с углами поворота –72, 0 и +48 градусов

Изображения набора A3 100 с углами поворота –42, 0 и +72 градусов

Рис. 3. Изображения набора A3 100 с углами поворота –42, 0 и +72 градусов

  1. Устойчивость этой обученной реализации нейронной сети к поворотам изображения оказалась низкой. Можно предположить, что в обучающих наборах были только изображения с наиболее типичными углами поворота, например изображения самолетов в горизонтальном полете.
  2. Для всех исследованных наборов данных существует сравнительно небольшой диапазон углов поворота около 0 градусов, в котором нейронная сеть дает вероятность правильного распознавания > 0,9 (таблица 1).

Результаты распознавания наборов A1

Рис. 4. Результаты распознавания наборов A1

Результаты распознавания наборов A2

Рис. 5. Результаты распознавания наборов A2

Результаты распознавания наборов A3

Рис. 6. Результаты распознавания наборов A3

Таблица 1

Допустимый диапазон углов поворота изображения

Набор изображений

Размер объекта, пикселей

Диапазон углов поворота, градусов

A1 max

380

–15...+30

A2 max

128

–50...+50

A3 max

304

–10...+50

A1 100

100

–40...+40

A2 100

100

–70...+50

A3 100

100

–40...+70

A1 min

40

–20...+20

A2 min

35

–5...+40

A3 min

25

–90...+10

  1. Наилучшую устойчивость к повороту показало распознавание изображений с не очень малыми размерами объектов, но и с не очень большими (что также можно видеть в табл. 1).

Дальнейшие исследования будут связаны с влиянием изменения контраста изображения.

Литература:

1. Samaras S. et al. Deep learning on multi sensor data for counter UAV applications—A systematic review //Sensors. — 2019. — Т. 19. — №. 22. — С. 4837.

2. Redmon J., Farhadi A. Yolov3: An incremental improvement. — Текст: электронный // arXiv: [сайт]. — URL: https://arxiv.org/pdf/1804.02767.pdf (дата обращения: 25.05.2021).

3. Official English Documentation for ImageAI!. — Текст: электронный // Moses Olafenwa and John Olafenwa: [сайт]. — URL: https://imageai.readthedocs.io/en/latest/ (дата обращения: 25.05.2021).

Основные термины (генерируются автоматически): нейронная сеть, поворот изображения, изображение набора, обученная реализация, результат распознавания наборов, угол поворота, градус, набор данных, правильное распознавание.


Ключевые слова

нейронная сеть, распознавание, поворот изображения

Похожие статьи

Процесс распознавания изображения нейронной сетью

В данной статье рассмотрены особенности распознавания изображения нейронной сетью.

Нейронная сеть — это математическая модель и ее реализация в виде программной или

Чтобы распознать изображение, нейронная сеть сначала должна быть обучена на данных.

Влияние масштабирования на распознавание объектов...

Исследовано влияние масштабирования изображения объекта на вероятность правильного распознавания нейронной сетью YOLOv3.

Рис. 3. Изображения из набора A3 с размерами объекта 152, 76, 38 пикселей. Нейронная сеть запускалась в облачной среде Google Colab.

Распознавание английского текста сверточной нейронной сетью

Простые искажения изображения, такие как сдвиг, поворот и угловое смещение могут быть устранены путем применения простых аффинных преобразований. Также, для улучшения качества работы нейронной сети подаваемые на вход изображения дополнительно...

Обзор методов распознавания изображений | Статья в сборнике...

Слой состоит из набора ядер и вычисляет свёртку выходного изображения из предыдущего слоя с помощью этого набора, на каждой итерации

Нейронная сеть — это сеть с конечным числом слоев из однотипных элементов — аналогов нейронов с различными типами связей...

Аппаратная реализация искусственных нейронных сетей.

Представлены методы аппаратной реализации искусственных нейронных сетей с

Несмотря на то, что адаптация цифровой логики КМОП для ИНС приводит к довольно простой конструкции, результатом по сути не

Распознавание речи на основе искусственных нейронных сетей.

Анализ методов распознавания образов | Статья в журнале...

Нейронные сети. Отдельный класс методов распознавания.

обучающая выборка имеет недостаточное количество обучающих параметров и сеть не. Поэтому кроме класса тестируемого примера, сеть вычисляет коэффициент уверенности в данном решении.

Математическое моделирование систем распознавания...

Входные данные для осуществления распознавания — это изображения, которые были получены в результате процессов предварительной

Распознавание (обучение с учителем) — отнесение предъявляемых объектов к определённым классам с помощью применения...

Анализ методов обнаружения лиц на изображении

Задача обнаружения лица на изображении часто является первым шагом в процессе решения задачи более высокого уровня — распознавания лица, деталей лица или его мимики. Кроме того, информация о присутствии и количестве лиц на изображении может быть полезна в...

Результаты обучения нейронной сети

3.3 Подготовка данных для обучения нейронной сети. Для подготовки данных необходим набор изображений , подающихся на вход алгоритму FE, а также идентификатор пользователя для каждого изображения: . Для начала, по всему набору изображений считаются вектора...

Похожие статьи

Процесс распознавания изображения нейронной сетью

В данной статье рассмотрены особенности распознавания изображения нейронной сетью.

Нейронная сеть — это математическая модель и ее реализация в виде программной или

Чтобы распознать изображение, нейронная сеть сначала должна быть обучена на данных.

Влияние масштабирования на распознавание объектов...

Исследовано влияние масштабирования изображения объекта на вероятность правильного распознавания нейронной сетью YOLOv3.

Рис. 3. Изображения из набора A3 с размерами объекта 152, 76, 38 пикселей. Нейронная сеть запускалась в облачной среде Google Colab.

Распознавание английского текста сверточной нейронной сетью

Простые искажения изображения, такие как сдвиг, поворот и угловое смещение могут быть устранены путем применения простых аффинных преобразований. Также, для улучшения качества работы нейронной сети подаваемые на вход изображения дополнительно...

Обзор методов распознавания изображений | Статья в сборнике...

Слой состоит из набора ядер и вычисляет свёртку выходного изображения из предыдущего слоя с помощью этого набора, на каждой итерации

Нейронная сеть — это сеть с конечным числом слоев из однотипных элементов — аналогов нейронов с различными типами связей...

Аппаратная реализация искусственных нейронных сетей.

Представлены методы аппаратной реализации искусственных нейронных сетей с

Несмотря на то, что адаптация цифровой логики КМОП для ИНС приводит к довольно простой конструкции, результатом по сути не

Распознавание речи на основе искусственных нейронных сетей.

Анализ методов распознавания образов | Статья в журнале...

Нейронные сети. Отдельный класс методов распознавания.

обучающая выборка имеет недостаточное количество обучающих параметров и сеть не. Поэтому кроме класса тестируемого примера, сеть вычисляет коэффициент уверенности в данном решении.

Математическое моделирование систем распознавания...

Входные данные для осуществления распознавания — это изображения, которые были получены в результате процессов предварительной

Распознавание (обучение с учителем) — отнесение предъявляемых объектов к определённым классам с помощью применения...

Анализ методов обнаружения лиц на изображении

Задача обнаружения лица на изображении часто является первым шагом в процессе решения задачи более высокого уровня — распознавания лица, деталей лица или его мимики. Кроме того, информация о присутствии и количестве лиц на изображении может быть полезна в...

Результаты обучения нейронной сети

3.3 Подготовка данных для обучения нейронной сети. Для подготовки данных необходим набор изображений , подающихся на вход алгоритму FE, а также идентификатор пользователя для каждого изображения: . Для начала, по всему набору изображений считаются вектора...

Задать вопрос