Влияние контраста и шума на распознавание изображений нейронной сетью YOLOv3 | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 27 апреля, печатный экземпляр отправим 1 мая.

Опубликовать статью в журнале

Автор:

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №23 (365) июнь 2021 г.

Дата публикации: 01.06.2021

Статья просмотрена: 182 раза

Библиографическое описание:

Чивонго, Верданд Емил Сигфрид. Влияние контраста и шума на распознавание изображений нейронной сетью YOLOv3 / Верданд Емил Сигфрид Чивонго. — Текст : непосредственный // Молодой ученый. — 2021. — № 23 (365). — С. 117-120. — URL: https://moluch.ru/archive/365/81798/ (дата обращения: 16.04.2024).



Показано, что для распознавания изображений с помощью нейронной сети YOLOv3 желательно поддерживать контраст не менее 0,3 и отношение сигнал/шум не ниже 15 дБ, иначе вероятность правильного распознавания может оказаться ниже 0,9.

Ключевые слова: нейронная сеть, распознавание изображения, контраст, аддитивный нормальный шум.

Применение искусственных нейронных сетей для решения практических задач становится все более широким [1]. Нейронная сеть YOLOv3 [2] для распознавания объектов на изображениях получила популярность в связи с ее высокой производительностью. Однако, в некоторых применениях, например, в системах обнаружения дронов [3], нужно знать те особенности и характеристики сети, которые мало представлены в доступных источниках. В частности, нужно знать, как сеть будет реагировать на условия плохого освещения, что приводит к низкому контрасту и зашумленности входных изображений.

В связи с этим цель данной работы состояла в том, чтобы получить зависимости вероятности правильного распознавания от контраста и отношения сигнал/шум на изображениях.

Контраст (контрастность) K вычислялся как отношение:

,

где:

W — яркость наиболее светлого пикселя;

B — яркость наиболее темного пикселя.

Были созданы три набора данных, которые содержали по 60 изображений с различным контрастом (примеры приведены на рис. 1).

Изображения из наборов A1C (слева), A2C (посредине) и A3C (справа) с контрастом 1 (вверху) и 0,33 (внизу)

Рис. 1. Изображения из наборов A1C (слева), A2C (посредине) и A3C (справа) с контрастом 1 (вверху) и 0,33 (внизу)

Изображения распознавались с помощью нейронной сети ImageAI YOLOv3, которая запускалась в облачной среде Google Colab. Результаты обработки приведены на рис. 2.

Влияние контраста на вероятность правильного распознавания

Рис. 2. Влияние контраста на вероятность правильного распознавания

Из них видно, что снижение контраста менее значения 0,3 нежелательно, так как легко может привести к падению вероятности правильного распознавания ниже 0,9.

Воздействие аддитивного шума моделировалось путем его сложения с исходным изображением контраста 0,33. Программная модель создавала нормальный некоррелированный шум. Были созданы три набора данных по 60 изображений с различным уровнем шума. Примеры из набора A1N приведены на рис. 3.

Изображения с отношениями сигнал/шум 30 дБ, 20 дБ и 10 дБ

Рис. 3. Изображения с отношениями сигнал/шум 30 дБ, 20 дБ и 10 дБ

Отношение сигнал/шум в децибелах (дБ) вычислялось через логарифм отношения размаха полезного видеосигнала к среднеквадратичному значению шума:

,

где:

– SNR — отношение сигнал/шум, дБ;

W — яркость наиболее светлого пикселя до внесения шума;

B — яркость наиболее темного пикселя до внесения шума;

N — среднеквадратическое отклонение шума яркости пикселей.

Результаты обработки приведены на рис. 4. По ним видно, что ухудшение отношения сигнал/шум ниже 15 дБ вполне может снизить вероятность правильного распознавания ниже 0,9. Можно также предположить, что чем меньше площадь объекта на изображении при прочих равных условиях, тем значительнее влияние шума.

Влияние шума на вероятность правильного распознавания

Рис. 4. Влияние шума на вероятность правильного распознавания

Например, объекты на изображениях наборов A1N, A2N и A3N имели одинаковые линейные размеры около 100 пикселей, но разную площадь, в A1N — наименьшую, в A3N — наибольшую. Соответственно, на A1N шум оказал наибольшее влияние, на A3N — наименьшее.

В целом можно сделать вывод, что при работе с нейронной сетью YOLOv3 желательно поддерживать контраст не менее 0,3 и отношение сигнал/шум не ниже 15 дБ.

В ходе дальнейшей работы предполагается провести аналогичные исследования для нейронных сетей TinyYOLOv3 и RetinaNet.

Литература:

1. Official English Documentation for ImageAI!. — Текст: электронный // Moses Olafenwa and John Olafenwa: [сайт]. — URL: https://imageai.readthedocs.io/en/latest/ (дата обращения: 25.05.2021).

2. Redmon J., Farhadi A. Yolov3: An incremental improvement. — Текст: электронный // arXiv: [сайт]. — URL: https://arxiv.org/pdf/1804.02767.pdf (дата обращения: 25.05.2021).

3. Samaras S. et al. Deep learning on multi sensor data for counter UAV applications—A systematic review //Sensors. — 2019. — Т. 19. — №. 22. — С. 4837.

Основные термины (генерируются автоматически): правильное распознавание, нейронная сеть, изображение, шум, SNR, влияние шума, внесение шума, набор данных, светлый пиксель, темный пиксель.


Ключевые слова

нейронная сеть, контраст, распознавание изображения, аддитивный нормальный шум

Похожие статьи

Процесс распознавания изображения нейронной сетью

Нейронная сеть для распознавания изображений, пожалуй, самый популярный способ использования нейронных сетей. При этом, вне зависимости от характеристик решаемых задач, он работает поэтапно, наиболее важные из которых рассматриваются ниже.

Использование нейронных сетей для очистки изображений от...

Полученный шум был наложен на изображения из используемой библиотеки следующим образом

Шум — беспорядочные колебания различной физической природы, отличающиеся

Поскольку случайный шум не ограничен во времени, то чем больше выборка данных при...

Распознавание английского текста сверточной нейронной сетью

Размер каждого изображения составляет пикселя. Каждый пиксель кодируется числом в

Рис. 5. Пример работы нейронной сети для одной буквы с добавлением различного шума

Сегментация текста на изображении. Для использования полученной нейронной сети для...

Влияние масштабирования на распознавание объектов...

 Исследовано влияние масштабирования изображения объекта на вероятность правильного распознавания нейронной сетью YOLOv3. Получена оценка минимально допустимого размера объекта на изображении. Ключевые слова: нейронная сеть, распознавание, изображение...

Влияние поворота изображения объекта на распознавание...

Ключевые слова: нейронная сеть, распознавание, поворот изображения. Искусственные нейронные сети в настоящее время применяются в самых различных областях, в том числе в системах обеспечения безопасности для распознавания объектов [1]...

Обзор методов распознавания изображений | Статья в сборнике...

Свёрточные нейронные сети. Свёрточная нейронная сеть (Convolutional neural network или CNN) — специальная архитектура нейронных сетей, предложенная в 1988

Непосредственно рекуррентные сети для задачи распознавания изображений использовались нечасто, но в...

Устранение полосового шума и зарисовывание пропущенных...

В задачах устранения полосового шума параметры пикселей в строках или столбцах часто считаются одинаковыми. Мы используем метод согласования моментов [4] для получения усиления и смещения полос пикселей. Таким образом, метод согласования моментов является...

Интеллектуальные системы анализа изображений

 В прикладных интеллектуальных системах анализа изображений основными функциональными задачами являются оценки качества изображения, определения границ объекта, классификация, кластеризация и распознавания образов.

Похожие статьи

Процесс распознавания изображения нейронной сетью

Нейронная сеть для распознавания изображений, пожалуй, самый популярный способ использования нейронных сетей. При этом, вне зависимости от характеристик решаемых задач, он работает поэтапно, наиболее важные из которых рассматриваются ниже.

Использование нейронных сетей для очистки изображений от...

Полученный шум был наложен на изображения из используемой библиотеки следующим образом

Шум — беспорядочные колебания различной физической природы, отличающиеся

Поскольку случайный шум не ограничен во времени, то чем больше выборка данных при...

Распознавание английского текста сверточной нейронной сетью

Размер каждого изображения составляет пикселя. Каждый пиксель кодируется числом в

Рис. 5. Пример работы нейронной сети для одной буквы с добавлением различного шума

Сегментация текста на изображении. Для использования полученной нейронной сети для...

Влияние масштабирования на распознавание объектов...

 Исследовано влияние масштабирования изображения объекта на вероятность правильного распознавания нейронной сетью YOLOv3. Получена оценка минимально допустимого размера объекта на изображении. Ключевые слова: нейронная сеть, распознавание, изображение...

Влияние поворота изображения объекта на распознавание...

Ключевые слова: нейронная сеть, распознавание, поворот изображения. Искусственные нейронные сети в настоящее время применяются в самых различных областях, в том числе в системах обеспечения безопасности для распознавания объектов [1]...

Обзор методов распознавания изображений | Статья в сборнике...

Свёрточные нейронные сети. Свёрточная нейронная сеть (Convolutional neural network или CNN) — специальная архитектура нейронных сетей, предложенная в 1988

Непосредственно рекуррентные сети для задачи распознавания изображений использовались нечасто, но в...

Устранение полосового шума и зарисовывание пропущенных...

В задачах устранения полосового шума параметры пикселей в строках или столбцах часто считаются одинаковыми. Мы используем метод согласования моментов [4] для получения усиления и смещения полос пикселей. Таким образом, метод согласования моментов является...

Интеллектуальные системы анализа изображений

 В прикладных интеллектуальных системах анализа изображений основными функциональными задачами являются оценки качества изображения, определения границ объекта, классификация, кластеризация и распознавания образов.

Задать вопрос