Библиографическое описание:

Романов С. А., Лепешкин О. М., Стоянов Ю. П. Анализ методов сегментации изображений // Молодой ученый. — 2010. — №6. — С. 26-28.

Сегментация является промежуточным этапом между обнаружением движения и этапами сопровождения и распознавания объектов. На этом этапе происходит группирование разрозненных участков или фрагментов изображения в область, принадлежащую одному объекту, или разделение какого либо участка изображения на области, принадлежащие разным объектам. При этом группирование осуществляется по различным признакам, таким как яркость, цвет, текстура, движение в одном направлении, с одинаковой скоростью и тому подобные признаки. Применение способа группирования, по тому или иному признаку, зависит от задачи, которую необходимо решить. Так как этап сегментации предшествует этапам более высокого уровня обработки изображения (сопровождение, распознавание объектов), то к методам сегментации применяются определенные требования. В общем случае данные требования можно сформулировать следующим образом:

- максимальное соответствие сегментированной области реальному объекту;

- работа в режиме реального времени;

- низкая вероятность ошибок;

- устойчивая работа в сложных условиях.

Исходя из сформулированных требований, проведем анализ наиболее часто применяемых методов, с целью выявления их слабых и сильных сторон:

1. Методы, основанные на применении бинаризации

Сущность данных методов заключается в сведении изображения к бинарному используя яркостную характеристику пикселей и дальнейшую обработку алгоритмами выделения однородных областей. Алгоритмы основаны на принципе кластеризации. Наиболее распространенный алгоритм этой группы методов это алгоритм k-средних.

2. Методы, основанные на поиске границ регионов

Эти методы находят границы регионов, а затем и сами регионы исходя из найденных границ. Чаще всего для выделения границ используется высокочастотный фильтр, для бинаризации используется k-кластеризация, а выделение регионов на бинарном изображении происходит с помощью алгоритма последовательного сканирования.

1.                  Методы, основанные на поиске регионов.

Данные методы находят регионы непосредственно, объединяя соседние пиксели в регионы по схожести параметров (цвет, яркость и т.д.). Строится вероятностная модель характеристик пикселей определяющих класс соответствующий некоторому региону и производится сравнение параметров пикселей путем применения порога. Эти методы лежат в основе таких методов, как:

- метод слияния регионов;

- метод разбиения и слияния регионов;

- метод "водораздела".

4. Методы, использующие Марковское случайное поле

Данные методы основаны на предположении, что цвет каждой точки изображения зависит от цветов некоторого множества соседних точек. Применение Марковского случайного поля позволяет учитывать различия в текстуре при сегментации. [1]

5. Методы теории графов

Сущность данных методов заключается в том, что изображение представляется в виде взвешенного графа, с вершинами в точках изображения. Вес ребра графа отражает сходство точек. Разбиение изображения моделируется разрезами графа. Обычно в методах теории графов вводится функционал «стоимости» разреза, отражающий качество полученной сегментации. Так задача разбиения изображения на однородные области сводится к оптимизационной задаче поиска разреза минимальной стоимости на графе.

Наиболее часто применяемыми методами теории графов являются:

- жадные алгоритмы;

- методы динамического программирования;

- алгоритм Дейкстры;

- метод Normalized;

- метод Nested Cuts;

- метод сегментации SWA. [2].

6. Методы использующие  признак движения

В данных методах сегментация производится по оценке вектора движения. Основой определения векторов движения является уравнение оптического потока:

,                                                       

где  – яркостной вектор-градиент по пространственным координатам;  –  производная яркости по времени;

V = () – вектор движения.

Принцип группирования (разгруппирования) основан на определении совпадений у соседних пикселей таких параметров как яркость и скорость движения. В этих методах применяется значение порога к текущему параметру пикселя для сравнения со статистической моделью какой-либо области изображения   [3].

Основные достоинства и недостатки, которые свойственны рассмотренным методам, приведены в таблице 1:

Таблица 1: Достоинства и недостатки методов сегментации

п/п

Наименование метода

достоинства

недостатки

1

Методы, основанные на применении бинаризации

- простота реализации;

- высокая скорость обработки.

- большая вероятность ошибочной сегментации

2

Методы, основанные на поиске границ регионов

- возможность изменения порога классификации;

- низкая чувствительность к изменениям характеристик изображения.

 

- алгоритм не работает при разрыве границы;

- неточное выделение областей;

- низкая скорость работы;

- многоступенчатость метода.

3

Методы, основанные на поиске регионов

- широкая область применения;

- возможность изменения порога классификации;

- скорость работы;

-устойчивость к ошибкам на первых этапах метода;

-точность сегментации.

 

- при работе с большими областями возрастает вероятность ошибки и снижается быстродействие.

4

Методы использующие Марковское случайное поле

- высокое качество сегментации по текстуре.

 

- сложность  реализации.

5

Методы теории графов

- возможность помимо однородности цвета и текстуры сегментов управлять также формой сегментов, их размером и сложностью границ.

- низкая скорость работы;

- большие затраты памяти.

 

6

Методы основанные на признаке движения

- точность сегментации.

- при изменении освещенности возможно появление аномальных векторов;

- большая вычислительная сложность.

 

Анализ методов сегментации показывает, что все они не лишены недостатков. Поэтому выбор того или иного метода зависит от конкретной задачи. Видно, что большинство методов ориентировано под определенные признаки сегментации (яркость, цвет, текстура, скорость и т.п.). Так же при выборе метода сегментации необходимо учитывать и то, что свойства объектов, под влиянием внешних факторов могут изменяться. Например, при изменении освещенности (интенсивности солнечного света) меняются яркостные характеристики объектов, или объекты имеют неоднородную яркость или  слабо выраженную текстуру. В случае нахождения в кадре множества объектов с похожими признаками, двигающихся по произвольным траекториям, перекрывающим друг друга, провести точную сегментацию практически невозможно.

В качестве примера комбинированного подхода можно привести алгоритм сегментации по цветовым характеристикам пикселей с выделением зон оценки признаков движения:

1. Изменение цветового пространства.

 Наиболее часто в качестве отличительного признака используют цвет. Обычно работа алгоритмов сегментации производится в цветовом пространстве RGB. В RGB цветовом пространстве используются три основных цвета: красный, синий и зеленый. В таком представлении степень освещенности объекта имеет очень сильное влияние на цветовое восприятие. Избежать этого можно перейдя в другие цветовые пространства, где отдельно выражены цветовые и яркостные составляющие. Такими пространствами являются пространства HSB, HSL и HSV где цветовая составляющая описывается следующими параметрами: цветовой тон - H и насыщенность – S, а характеристика освещенности представляется одним из трех параметров: яркость – B, светлота L, значение V (что по сути одно и тоже).

2. Определение регионов. 

Обход изображения начинается с левого верхнего пикселя слева направо и сверху вниз. Применяется 4-связность,  где соседями для пикселя считаются 4 пикселя: сверху, слева, справа, снизу.

А. Считаем значение первого пикселя P1 соответствующим некоторому классу S1. S1(Y1, U1,V1), где   Y1(x1, µ1, δ12); U1 (x1, µ1, δ12);  V1 (x1, µ1, δ12);     Каждая компонента пространства  YUV  характеризуется параметрами нормального распределения  (математическим ожиданием µ и дисперсией δ2, x – значение компоненты).

В.  Производим сравнение соседнего правого пикселя  с классом  S1. Для сравнения применяем порог.  Если значение пикселя удовлетворяет порогу, то относим его к этому классу, если не удовлетворяет, то создаем новый класс S2  .

С. В дальнейшем продолжаем обход изображения и сравнение каждого пикселя в соответствии с видов связности. Отношение к тому или иному классу производится по наименьшему отклонению параметров пикселя от характеристик класса.

 3. Слияние (разделение) регионов по признакам движения

А. В результате применения цветовой сегментации в пространстве HSB (HSL, HSV) получаем набор регионов, в которых пиксели объединены по цветовому признаку.  На границах непосредственно соприкасающихся регионов выделяем зоны пикселей для анализа движения.

В. Определяем вектора движения в выделенных зонах.

С. Производим сравнительный анализ векторов движения в соседних выделенных областях. Если вектора движения совпадают, то регионы объединяются, если не совпадают, то считаем их принадлежащими разным объектам.

Данный алгоритм позволяет решать задачу сегментации перекрывающихся объектов. Переход из пространства RGB в пространство HSB (HSL, HSV) позволяет избежать ошибки в цветовой сегментации.

Очевидно, что при решении сложных задач, на этапе сегментации, предшествующему более высоким этапам обработки изображений, необходимо использовать комбинированный подход. При этом необходимо добиться высокой точности сегментации, минимальных затрат временных и вычислительных ресурсов.

 

Библиографический список:

  1. Форсайт Д., Понс Ж. «Компьютерное зрение. Современный подход», Москва. Санкт-Питербург. Киев 2004г. – 465с.
  2. Конушин В., Вежневец В.. Методы сегментации изображений: интерактивная сегментация. Компьютерная графика и мультимедиа. Выпуск №5(1)/2007.
  3. Обухова,  Н.А. Сегментация объектов интереса на основе признака движения в видеокомпьютерных системах / Н.А.Обухова // Инфокоммуникационные технологии. -  2007 - №1 – C.77-85.

Обсуждение

Социальные комментарии Cackle