Библиографическое описание:

Терентьева Е. С. Непараметрические модели статических объектов при наличии пропусков данных // Молодой ученый. — 2010. — №9. — С. 45-50.

Выбор одного из методов построения модели системы зависит от априорной информации о ней. Если субъект обладает ограниченной информацией, например, только выборкой наблюдений входных и выходных воздействий системы, то моделирование можно произвести одним из непараметрических методов, которые не требует сведений о составе и структуре системы.  В большинстве случаев построения модели реального процесса аналитику приходится иметь дело с выборками малого объема, причем в пространстве наблюдений результаты измерений распределены неравномерно. Этот факт часто вызван большими затратами на проведение экспериментов для снятия наблюдений, отсутствием возможности проводить дополнительные эксперименты в случае нормального функционирования объекта либо отсутствием возможности повторить эксперимент при одних и тех же условиях. Это приводит к тому, что в некоторых подобластях пространства наблюдений образуются «пустоты». В данных условиях построение стандартной непараметрической оценки регрессии дает неудовлетворительные результаты.

Пусть имеется неравномерная выборка наблюдений  входных и выходных переменных системы объемом s.  Здесь - значение вектора наблюдений входных воздействий размерности m в i-ой точке выборки, а xi - значение выходного воздействия в этой точке. Требуется построить непараметрическую модель объекта на основе непараметрической оценки регрессии, имеющей следующий вид [1]:

                        ,                                   (1)

где - колоколообразная функция, удовлетворяющая следующим условиям [1]:

,              (2)

здесь δ(t) - дельта-функция Дирака. Параметр размытости Сs должен удовлетворять следующим условиям [1]:

                                                (3)

Предлагается использовать непараметрическую оценку регрессии, основанную на использовании не конкретного значения выходной переменной в j-ой точке выборки, а ее оценки. Проводить это оценивание будем по нижеизложенному алгоритму.

Пусть мы находимся в i-ой точке выборки, определяются соседние точки выборки, в которых колоколообразная функция не равна нулю:

,                                 (4)

где колоколообразная функция:

,

расширяется в направлении разрежений в выборке, то есть ее ветви имеют разные константы Липшица. Здесь  - шаг,  – коэффициент «расширения» колоколообразной функции, при l=1 колоколообразная функция принимает симметричный вид.

Для определения сгущений и разрежений точек в выборке введем функцию множества, которая имеет вид непараметрической оценки плотности Розенблата-Парзена [2] с малым параметром размытости сs:

                          (5)

Через точки (1) проводим поверхность , параметры которой определяются по методу наименьших квадратов.

Непараметрическая оценка регрессии примет следующий вид [3]:

.                 (6)

Чтобы оценить параметр размытости в этой формуле для j-ой точки выборки будем использовать следующую формулу:

.                                                 (7)

Выбор оптимального параметра размытости  и коэффициента пропорциональности p осуществляется путем минимизации критерия:

.                                       (8)

Приведем некоторые численные результаты моделирования.

Пусть имеется неравномерная выборка наблюдений случайной величины , , объемом s=30, , , где ,  - аддитивная центрированная помеха, имеющая нормальный закон распределения с  и . Расположение точек  на указанном интервале приведено на рисунке 1.

Рисунок 1

Пусть помехи в каналах измерения отсутствуют, а  имеет линейный вид, коэффициенты  определяются по методу наименьших  квадратов на основании точек . Результат моделирования приведен на рисунке 2.

Рисунок 2

Очевидно, что оценка регрессии (1) в областях разрежений выборки дает неудовлетворительные результаты. Среднеквадратичная оценка ошибки моделирования равна 4,95%. При использовании модифицированной оценки регрессии (6) с несимметричной колоколообразной функцией оценка ошибки моделирования равна 2,25%.

Результаты моделирования при 15% помехе в каналах измерения и неизменных остальных условиях приведены на рисунке 3.

Рисунок 3

Среднеквадратичная оценка ошибки моделирования при использовании стандартной непараметрической оценки регрессии (1) равна 6%. При использовании модифицированной оценки регрессии с несимметричной колоколообразной функции оценка ошибки моделирования равна 4,4%.

Зависимость ошибки моделирования при использовании оценок регрессии (1) и (6) от уровня шума в % приведена на рисунке 4.

Рисунок 4

Таким образом, можно отметить, что ошибка моделирования при использовании модифицированной оценки регрессии (6) примерно в 2 раза меньше, чем при использовании стандартной непараметрической оценки (1).

Выберем другой объект с одномерным входным и выходным воздействиями. Для этого примем . Объем выборки по-прежнему равен 30: . Пусть выборка наблюдений относительно равномерна и не имеет больших пробелов. Результаты моделирования приведены на рисунке 5.

Рисунок 5

Среднеквадратичная оценка ошибки моделирования при использовании стандартной непараметрической оценки регрессии (1) равна 1,9%. При использовании модифицированной оценки регрессии (6) с несимметричной колоколообразной функции ошибка равна 0,77%, что в 2,5 раза меньше, чем при использовании стандартной оценки.

Таким образом, даже при разреженной выборке наблюдений, без явных пробелов ошибка моделирования с использованием модифицированной оценки регрессии (6) меньше, чем с использованием стандартной.

Пусть размерность входной переменной равна двум, и имеется неравномерная выборка наблюдений , объемом s=200,  , на области , ; , где ,  - аддитивная центрированная помеха, имеющая нормальный закон распределения с математическим ожиданием  и ограниченной  дисперсией. Создадим пробел в выборке наблюдений. Расположение точек  приведено на рисунке 6.

Пусть в каналах измерения присутствует 5% помеха, а  имеет линейный вид (плоскость), где  - входные переменные. Графически результат моделирования в виде среза представлен на рисунке 7.

Рисунок 6

Рисунок 7

Среднеквадратичная оценка ошибки моделирования при использовании стандартной непараметрической оценки регрессии (1) равна 3,3%. При использовании модифицированной оценки регрессии (6) с несимметричной колоколообразной функции оценка ошибки равна 1,5%, что в 2 раза меньше, чем при использовании стандартной оценки.

Пусть имеется неравномерная выборка наблюдений одномерных входного и выходного воздействий объекта , , объемом s=30, , , где ,  - центрированная помеха, распределенная нормально с нулевым математическим ожиданием и ограниченной дисперсией. Пусть функция  имеет квадратичный вид. Помеха в каналах измерения 10%.

Результаты моделирования приведены на рисунке 8.

Рисунок 8

При построении модели этого же объекта, но производя аппроксимацию линейным полиномом , среднеквадратичная ошибка моделирования в 1,9 раза больше, чем при аппроксимации квадратичным полиномом. При дальнейшем увеличении порядка аппроксимирующего полинома ошибка моделирования практически не изменяется, а при порядках полинома больше 4 ошибка моделирования увеличивается. Таким образом, предлагается использовать второй порядок аппроксимирующего полинома .

Были проведены численные исследования алгоритмов непараметрического моделирования (1) и (6) на равномерных выборках наблюдений, а также сравнение ошибок моделирования при использовании симметричной и несимметричной колоколообразных функций.

Подведем итоги проведенных численных исследований.

Во-первых,  разработанный метод построения непараметрических моделей позволяет довольно эффективно проводить моделирование процессов и объектов в случае неравномерно распределенной выборки наблюдений входных и выходных переменных, что подтверждают численные исследования приведенные выше. Среднеквадратичная ошибка моделирования при использовании непараметрической оценки регрессии (6) с несимметричной колоколообразной функции в несколько раз меньше, чем при использовании оценки регрессии (1).

Во-вторых, применение несимметричной колоколообразной функции позволяет добиться большей согласованности модели и объекта, по сравнению с симметричной.

В-третьих, с увеличением помехи в каналах измерения выходной переменной ухудшается качество моделирования. Однако ошибка моделирования при использовании модифицированной оценки регрессии (6) все же остается в несколько раз меньше, чем при использовании стандартной оценки (1).

В-четвертых, применение вышеупомянутых оценок регрессии для моделирования на основе равномерной выборки наблюдений входных и выходных переменных объекта дает одинаково малые ошибки идентификации. Следовательно, модифицированную оценку регрессии можно применять не только на неравномерных или разреженных выборках, но и на равномерных.

В заключение стоит отметить, что при увеличении размерности входной переменной на единицу время расчета модели при использовании модифицированной непараметрической оценки регрессии с несимметричной колоколообразной функцией увеличивается в среднем в полтора раза при фиксированном объеме выборки наблюдений.

 

Библиографический список

1.      Надарая Э.А. Замечания о непараметрических оценках плотности вероятности и кривой регрессии / Э.А. Надарая // Теория вероятности и ее применение.- Т. 15, вып. 1, 1970.-с. 139-142.

2.      Парзен Е. (Parzen E.). On estimation of a probability density function and mode.—Ann. Math. Stat., 1962, v. 33, 1065— 1076.

3.      Катковник В.Я. Непараметрическая идентификация и сглаживание данных / В.Я. Катковник М.: Наука, 1985. 427с.

 

Обсуждение

Социальные комментарии Cackle