Влияние контраста и шума на распознавание изображений нейронной сетью YOLOv3

Чивонго, Верданд Емил

Влияние контраста и шума на распознавание изображений нейронной сетью YOLOv3

Автор: Чивонго Верданд Емил Сигфрид

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №23 (365) июнь 2021 г.

Дата публикации: 01.06.2021 2021-06-01

Статья просмотрена: 347 раз

Скачать электронную версию

Скачать Часть 2 (pdf)

Библиографическое описание:

Чивонго, Верданд Емил Сигфрид. Влияние контраста и шума на распознавание изображений нейронной сетью YOLOv3 / Верданд Емил Сигфрид Чивонго. — Текст : непосредственный // Молодой ученый. — 2021. — № 23 (365). — С. 117-120. — URL: https://moluch.ru/archive/365/81798/ (дата обращения: 05.04.2025).

Показано, что для распознавания изображений с помощью нейронной сети YOLOv3 желательно поддерживать контраст не менее 0,3 и отношение сигнал/шум не ниже 15 дБ, иначе вероятность правильного распознавания может оказаться ниже 0,9.

Ключевые слова: нейронная сеть, распознавание изображения, контраст, аддитивный нормальный шум.

Применение искусственных нейронных сетей для решения практических задач становится все более широким [1]. Нейронная сеть YOLOv3 [2] для распознавания объектов на изображениях получила популярность в связи с ее высокой производительностью. Однако, в некоторых применениях, например, в системах обнаружения дронов [3], нужно знать те особенности и характеристики сети, которые мало представлены в доступных источниках. В частности, нужно знать, как сеть будет реагировать на условия плохого освещения, что приводит к низкому контрасту и зашумленности входных изображений.

В связи с этим цель данной работы состояла в том, чтобы получить зависимости вероятности правильного распознавания от контраста и отношения сигнал/шум на изображениях.

Контраст (контрастность) K вычислялся как отношение:

где:

– W — яркость наиболее светлого пикселя;

– B — яркость наиболее темного пикселя.

Были созданы три набора данных, которые содержали по 60 изображений с различным контрастом (примеры приведены на рис. 1).

Изображения из наборов A1C (слева), A2C (посредине) и A3C (справа) с контрастом 1 (вверху) и 0,33 (внизу)

Рис. 1. Изображения из наборов A1C (слева), A2C (посредине) и A3C (справа) с контрастом 1 (вверху) и 0,33 (внизу)

Изображения распознавались с помощью нейронной сети ImageAI YOLOv3, которая запускалась в облачной среде Google Colab. Результаты обработки приведены на рис. 2.

Влияние контраста на вероятность правильного распознавания

Рис. 2. Влияние контраста на вероятность правильного распознавания

Из них видно, что снижение контраста менее значения 0,3 нежелательно, так как легко может привести к падению вероятности правильного распознавания ниже 0,9.

Воздействие аддитивного шума моделировалось путем его сложения с исходным изображением контраста 0,33. Программная модель создавала нормальный некоррелированный шум. Были созданы три набора данных по 60 изображений с различным уровнем шума. Примеры из набора A1N приведены на рис. 3.

Рис. 3. Изображения с отношениями сигнал/шум 30 дБ, 20 дБ и 10 дБ

Отношение сигнал/шум в децибелах (дБ) вычислялось через логарифм отношения размаха полезного видеосигнала к среднеквадратичному значению шума:

где:

– SNR — отношение сигнал/шум, дБ;

– W — яркость наиболее светлого пикселя до внесения шума;

– B — яркость наиболее темного пикселя до внесения шума;

– N — среднеквадратическое отклонение шума яркости пикселей.

Результаты обработки приведены на рис. 4. По ним видно, что ухудшение отношения сигнал/шум ниже 15 дБ вполне может снизить вероятность правильного распознавания ниже 0,9. Можно также предположить, что чем меньше площадь объекта на изображении при прочих равных условиях, тем значительнее влияние шума.

Рис. 4. Влияние шума на вероятность правильного распознавания

Например, объекты на изображениях наборов A1N, A2N и A3N имели одинаковые линейные размеры около 100 пикселей, но разную площадь, в A1N — наименьшую, в A3N — наибольшую. Соответственно, на A1N шум оказал наибольшее влияние, на A3N — наименьшее.

В целом можно сделать вывод, что при работе с нейронной сетью YOLOv3 желательно поддерживать контраст не менее 0,3 и отношение сигнал/шум не ниже 15 дБ.

В ходе дальнейшей работы предполагается провести аналогичные исследования для нейронных сетей TinyYOLOv3 и RetinaNet.

Литература:

1. Official English Documentation for ImageAI!. — Текст: электронный // Moses Olafenwa and John Olafenwa: [сайт]. — URL: https://imageai.readthedocs.io/en/latest/ (дата обращения: 25.05.2021).

2. Redmon J., Farhadi A. Yolov3: An incremental improvement. — Текст: электронный // arXiv: [сайт]. — URL: https://arxiv.org/pdf/1804.02767.pdf (дата обращения: 25.05.2021).

3. Samaras S. et al. Deep learning on multi sensor data for counter UAV applications—A systematic review //Sensors. — 2019. — Т. 19. — №. 22. — С. 4837.

Основные термины (генерируются автоматически): правильное распознавание, нейронная сеть, изображение, шум, SNR, влияние шума, внесение шума, набор данных, светлый пиксель, темный пиксель.

Ключевые слова

нейронная сеть, контраст, распознавание изображения, аддитивный нормальный шум

нейронная сеть, распознавание изображения, контраст, аддитивный нормальный шум

Влияние контраста и шума на распознавание изображений нейронной сетью YOLOv3

Библиографическое описание:

Ключевые слова

Похожие статьи

Влияние поворота изображения объекта на распознавание нейронной сетью ImageAI YOLOv3

Влияние масштабирования на распознавание объектов нейронной сетью ImageAI YOLOv3

Моделирование особенностей бинаурального слуха и исследование спектрального состава звуковых сигналов

Алгоритм обновления биометрического шаблона с применением нейронной сети

Использование нейросетевых технологий в задаче автоматического распознавания эмоций

Использование обобщенных параметров группирующихся стираний и ошибок для адаптивного выбора длины блока в системах передачи данных

Реализация прямой структуры КИХ-фильтра в среде Matlab

Протокол передачи данных для устройства ввода информации

Управление перегрузками в распределенных нейронных сетях

Исследование эффективности гибридной нейросетевой архитектуры в контексте прогностического анализа энергопотребления в зданиях коммерческого назначения

Похожие статьи

Влияние поворота изображения объекта на распознавание нейронной сетью ImageAI YOLOv3

Влияние масштабирования на распознавание объектов нейронной сетью ImageAI YOLOv3

Моделирование особенностей бинаурального слуха и исследование спектрального состава звуковых сигналов

Алгоритм обновления биометрического шаблона с применением нейронной сети

Использование нейросетевых технологий в задаче автоматического распознавания эмоций

Использование обобщенных параметров группирующихся стираний и ошибок для адаптивного выбора длины блока в системах передачи данных

Реализация прямой структуры КИХ-фильтра в среде Matlab

Протокол передачи данных для устройства ввода информации

Управление перегрузками в распределенных нейронных сетях

Исследование эффективности гибридной нейросетевой архитектуры в контексте прогностического анализа энергопотребления в зданиях коммерческого назначения

Ответим на ваш вопрос!