Автор: Терентьева Елена Сергеевна

Рубрика: Технические науки

Опубликовано в Молодой учёный №9 (20) сентябрь 2010 г.

Статья просмотрена: 17 раз

Библиографическое описание:

Терентьева Е. С. Непараметрические модели статических объектов при наличии пропусков данных // Молодой ученый. — 2010. — №9. — С. 45-50.

Выбор одного из методов построения модели системы зависит от априорной информации о ней. Если субъект обладает ограниченной информацией, например, только выборкой наблюдений входных и выходных воздействий системы, то моделирование можно произвести одним из непараметрических методов, которые не требует сведений о составе и структуре системы.  В большинстве случаев построения модели реального процесса аналитику приходится иметь дело с выборками малого объема, причем в пространстве наблюдений результаты измерений распределены неравномерно. Этот факт часто вызван большими затратами на проведение экспериментов для снятия наблюдений, отсутствием возможности проводить дополнительные эксперименты в случае нормального функционирования объекта либо отсутствием возможности повторить эксперимент при одних и тех же условиях. Это приводит к тому, что в некоторых подобластях пространства наблюдений образуются «пустоты». В данных условиях построение стандартной непараметрической оценки регрессии дает неудовлетворительные результаты.

Пусть имеется неравномерная выборка наблюдений  входных и выходных переменных системы объемом s.  Здесь - значение вектора наблюдений входных воздействий размерности m в i-ой точке выборки, а xi - значение выходного воздействия в этой точке. Требуется построить непараметрическую модель объекта на основе непараметрической оценки регрессии, имеющей следующий вид [1]:

                        ,                                   (1)

где - колоколообразная функция, удовлетворяющая следующим условиям [1]:

,              (2)

здесь δ(t) - дельта-функция Дирака. Параметр размытости Сs должен удовлетворять следующим условиям [1]:

                                                (3)

Предлагается использовать непараметрическую оценку регрессии, основанную на использовании не конкретного значения выходной переменной в j-ой точке выборки, а ее оценки. Проводить это оценивание будем по нижеизложенному алгоритму.

Пусть мы находимся в i-ой точке выборки, определяются соседние точки выборки, в которых колоколообразная функция не равна нулю:

,                                 (4)

где колоколообразная функция:

,

расширяется в направлении разрежений в выборке, то есть ее ветви имеют разные константы Липшица. Здесь  - шаг,  – коэффициент «расширения» колоколообразной функции, при l=1 колоколообразная функция принимает симметричный вид.

Для определения сгущений и разрежений точек в выборке введем функцию множества, которая имеет вид непараметрической оценки плотности Розенблата-Парзена [2] с малым параметром размытости сs:

                          (5)

Через точки (1) проводим поверхность , параметры которой определяются по методу наименьших квадратов.

Непараметрическая оценка регрессии примет следующий вид [3]:

.                 (6)

Чтобы оценить параметр размытости в этой формуле для j-ой точки выборки будем использовать следующую формулу:

.                                                 (7)

Выбор оптимального параметра размытости  и коэффициента пропорциональности p осуществляется путем минимизации критерия:

.                                       (8)

Приведем некоторые численные результаты моделирования.

Пусть имеется неравномерная выборка наблюдений случайной величины , , объемом s=30, , , где ,  - аддитивная центрированная помеха, имеющая нормальный закон распределения с  и . Расположение точек  на указанном интервале приведено на рисунке 1.

Рисунок 1

Пусть помехи в каналах измерения отсутствуют, а  имеет линейный вид, коэффициенты  определяются по методу наименьших  квадратов на основании точек . Результат моделирования приведен на рисунке 2.

Рисунок 2

Очевидно, что оценка регрессии (1) в областях разрежений выборки дает неудовлетворительные результаты. Среднеквадратичная оценка ошибки моделирования равна 4,95%. При использовании модифицированной оценки регрессии (6) с несимметричной колоколообразной функцией оценка ошибки моделирования равна 2,25%.

Результаты моделирования при 15% помехе в каналах измерения и неизменных остальных условиях приведены на рисунке 3.

Рисунок 3

Среднеквадратичная оценка ошибки моделирования при использовании стандартной непараметрической оценки регрессии (1) равна 6%. При использовании модифицированной оценки регрессии с несимметричной колоколообразной функции оценка ошибки моделирования равна 4,4%.

Зависимость ошибки моделирования при использовании оценок регрессии (1) и (6) от уровня шума в % приведена на рисунке 4.

Рисунок 4

Таким образом, можно отметить, что ошибка моделирования при использовании модифицированной оценки регрессии (6) примерно в 2 раза меньше, чем при использовании стандартной непараметрической оценки (1).

Выберем другой объект с одномерным входным и выходным воздействиями. Для этого примем . Объем выборки по-прежнему равен 30: . Пусть выборка наблюдений относительно равномерна и не имеет больших пробелов. Результаты моделирования приведены на рисунке 5.

Рисунок 5

Среднеквадратичная оценка ошибки моделирования при использовании стандартной непараметрической оценки регрессии (1) равна 1,9%. При использовании модифицированной оценки регрессии (6) с несимметричной колоколообразной функции ошибка равна 0,77%, что в 2,5 раза меньше, чем при использовании стандартной оценки.

Таким образом, даже при разреженной выборке наблюдений, без явных пробелов ошибка моделирования с использованием модифицированной оценки регрессии (6) меньше, чем с использованием стандартной.

Пусть размерность входной переменной равна двум, и имеется неравномерная выборка наблюдений , объемом s=200,  , на области , ; , где ,  - аддитивная центрированная помеха, имеющая нормальный закон распределения с математическим ожиданием  и ограниченной  дисперсией. Создадим пробел в выборке наблюдений. Расположение точек  приведено на рисунке 6.

Пусть в каналах измерения присутствует 5% помеха, а  имеет линейный вид (плоскость), где  - входные переменные. Графически результат моделирования в виде среза представлен на рисунке 7.

Рисунок 6

Рисунок 7

Среднеквадратичная оценка ошибки моделирования при использовании стандартной непараметрической оценки регрессии (1) равна 3,3%. При использовании модифицированной оценки регрессии (6) с несимметричной колоколообразной функции оценка ошибки равна 1,5%, что в 2 раза меньше, чем при использовании стандартной оценки.

Пусть имеется неравномерная выборка наблюдений одномерных входного и выходного воздействий объекта , , объемом s=30, , , где ,  - центрированная помеха, распределенная нормально с нулевым математическим ожиданием и ограниченной дисперсией. Пусть функция  имеет квадратичный вид. Помеха в каналах измерения 10%.

Результаты моделирования приведены на рисунке 8.

Рисунок 8

При построении модели этого же объекта, но производя аппроксимацию линейным полиномом , среднеквадратичная ошибка моделирования в 1,9 раза больше, чем при аппроксимации квадратичным полиномом. При дальнейшем увеличении порядка аппроксимирующего полинома ошибка моделирования практически не изменяется, а при порядках полинома больше 4 ошибка моделирования увеличивается. Таким образом, предлагается использовать второй порядок аппроксимирующего полинома .

Были проведены численные исследования алгоритмов непараметрического моделирования (1) и (6) на равномерных выборках наблюдений, а также сравнение ошибок моделирования при использовании симметричной и несимметричной колоколообразных функций.

Подведем итоги проведенных численных исследований.

Во-первых,  разработанный метод построения непараметрических моделей позволяет довольно эффективно проводить моделирование процессов и объектов в случае неравномерно распределенной выборки наблюдений входных и выходных переменных, что подтверждают численные исследования приведенные выше. Среднеквадратичная ошибка моделирования при использовании непараметрической оценки регрессии (6) с несимметричной колоколообразной функции в несколько раз меньше, чем при использовании оценки регрессии (1).

Во-вторых, применение несимметричной колоколообразной функции позволяет добиться большей согласованности модели и объекта, по сравнению с симметричной.

В-третьих, с увеличением помехи в каналах измерения выходной переменной ухудшается качество моделирования. Однако ошибка моделирования при использовании модифицированной оценки регрессии (6) все же остается в несколько раз меньше, чем при использовании стандартной оценки (1).

В-четвертых, применение вышеупомянутых оценок регрессии для моделирования на основе равномерной выборки наблюдений входных и выходных переменных объекта дает одинаково малые ошибки идентификации. Следовательно, модифицированную оценку регрессии можно применять не только на неравномерных или разреженных выборках, но и на равномерных.

В заключение стоит отметить, что при увеличении размерности входной переменной на единицу время расчета модели при использовании модифицированной непараметрической оценки регрессии с несимметричной колоколообразной функцией увеличивается в среднем в полтора раза при фиксированном объеме выборки наблюдений.

 

Библиографический список

1.      Надарая Э.А. Замечания о непараметрических оценках плотности вероятности и кривой регрессии / Э.А. Надарая // Теория вероятности и ее применение.- Т. 15, вып. 1, 1970.-с. 139-142.

2.      Парзен Е. (Parzen E.). On estimation of a probability density function and mode.—Ann. Math. Stat., 1962, v. 33, 1065— 1076.

3.      Катковник В.Я. Непараметрическая идентификация и сглаживание данных / В.Я. Катковник М.: Наука, 1985. 427с.

 

Основные термины (генерируются автоматически): оценки регрессии, модифицированной оценки регрессии, непараметрической оценки регрессии, использовании модифицированной оценки, оценка ошибки моделирования, использовании стандартной, стандартной непараметрической оценки, ошибка моделирования, несимметричной колоколообразной, несимметричной колоколообразной функции, использовании стандартной непараметрической, использовании стандартной оценки, наблюдений входных, ошибки моделирования равна, Среднеквадратичная оценка ошибки, выборка наблюдений, каналах измерения, неравномерная выборка наблюдений, Результаты моделирования, выборки наблюдений.

Обсуждение

Социальные комментарии Cackle
Задать вопрос