Библиографическое описание:

Атапина Н. В. Кластеризация структуры портфеля автотранспортного страхования физических лиц // Молодой ученый. — 2011. — №1. — С. 88-91.

Начальная стадия методики андеррайтинга для страхования автотранспортных средств физических лиц заключается в изучении структуры страхового портфеля, его убыточности и факторов, влияющих на эффективность страхования. Проведенный анализ позволит прогнозировать показатели страхового портфеля в случае изменения его структуры. С этой целью определим кластеры по совокупности значимых взаимонезависимых факторов риска в соответствии с разбросом цен на рынке автотранспортных средств и статистикой страховой компании (условный пример).
Исследование рисков по автотранспортным средствам позволило выделить 10 факторов, отражающих состояние и условия эксплуатации застрахованных объектов:
– стоимость автомобиля;
– средний убыток по объекту;
– срок эксплуатации;
– износ;
– мощность;
– масса автомобиля;
– возраст водителя;
– стаж водителя;
– риск ДТП;
– вероятность угона.
Фактор («Износ») определен на основе «Методического руководства по определению стоимости автотранспортных средств с учетом естественного износа и технического состояния на момент предъявления» (РД 37.009.015/98 с изменениями №1, №2, №3, №4, №5, №6), утвержденного Минэкономики РФ 04.06.1998 г.
Фактор («Риск ДТП») определен на основании исследований, выполненных в научно-исследовательском центре РОСДОРНИИ для различных типов дорог в зависимости от коэффициента их загрузки, в том числе: многополосные и двухполосные дороги в населенных пунктах и вне населенных пунктов, с разделительной полосой и без нее, а также внутрипостроечные и грунтовые дороги [1].
Последний фактор установлен в соответствии со статистикой по угонам автомобилей в Российской Федерации в 2010 г. (в соответствии с данными МВД РФ).
Перейдем непосредственно к структуризации базового страхового портфеля с помощью кластерного анализа с учетом определенных выше факторов (10 факторов). Кластерный анализ выполнен с использованием пакета программ STASTICA, предназначенного для обработки статистических данных.
Базовый страховой портфель автотранспортного страхования физических лиц в 2010 г. включает следующие основные параметры страхования: 1 800 машин (договоров), совокупная страховая премия составила 54 844 430 руб., средняя страховая выплата – 26 000 руб.
На первом этапе кластерного анализа портфеля автотранспортного страхования физических лиц необходимо стандартизовать исходные данные, так чтобы каждая переменная имела среднее 0 и стандартное отклонение 1, и выяснить, формируют ли автомобили «естественные» кластеры, которые могут быть осмыслены.
В качестве правила объединения выберем метод Уорда, в качестве меры близости – евклидово расстояние.
Метод Уорда предполагает, что каждый объект – это отдельный кластер. Рассчитывается расстояние между объектами и в кластер объединяются наиболее «близкие» объекты. Метод Уорда приводит к образованию кластеров приблизительно равных размеров с минимальной внутрикластерной дисперсией [2].
Мера близости, определяемая евклидовым расстоянием, является геометрическим расстоянием в -мерном пространстве и вычисляется по формуле 1:

Врезка1


где – евклидово расстояние между -тым и -тым объектами;
– численное значение -той переменной для -того объекта;
– численное значение -той переменой для -того объекта;
– количество переменных, которыми описываются объекты.
Наиболее важным результатом, получаемым в результате кластеризации, является иерархическое дерево – дендрограмма (рис. 1).
Каждый узел дендрограммы представляет объединение двух или более кластеров, положение узлов на вертикальной оси определяет расстояние, на котором были объединены соответствующие кластеры.

Рис. 1. Дендрограмма объединения объектов (1 800 наблюдений)

Приведенная дендрограмма показывает, что наиболее оптимальным (чаще повторяющимся и имеющим достаточно прозрачную интерпретацию) является разбиение автомобилей на 6 «естественных» кластеров. Уточнение и оценку качества разбиения объектов на кластеры продолжим методом -средних (второй этап кластерного анализа).
Суть метода -средних состоит в исследовании заранее определенного количества классов , на которые необходимо разбить имеющиеся наблюдения, и начальных центров этих классов. Для каждого следующего наблюдения рассчитываются расстояния до центров кластеров, и данное наблюдение относится к тому кластеру, расстояние до которого было минимальным. После этого для данного кластера (в котором увеличилось количество наблюдений) рассчитывается новый центр тяжести (как среднее по каждому показателю) по всем включенным в кластер наблюдениям.
Разобьем исходные данные методом -средних на 6 кластеров и проверим значимость различия между полученными группами (табл. 1).
Значения межгрупповой и внутригрупповой дисперсии определяют «качество» кластеризации, насколько хорошо конкретный признак характеризует принадлежность объектов к кластеру.
Параметры и характеризуют вклад признака в разделение объектов на группы. В столбце «» приводится значение -критерия, используемого для проверки гипотезы о равенстве дисперсий признаков между кластерами и внутри кластеров, вероятность ошибки при принятии гипотезы о неравенстве дисперсий.

Табл. 1. Анализ дисперсии


Межгрупповые дисперсии

СС

Внутригрупповые дисперсии

СС

F

Значимость p

X1

784,248

5

1014,752

1794

277,2975

0,000000

X2

626,743

5

1172,257

1794

191,8312

0,000000

X3

263,356

5

1535,643

1794

61,5327

0,000000

X4

1253,217

5

545,783

1794

823,8699

0,000000

X5

141,896

5

1657,104

1794

30,7237

0,000000

X6

129,417

5

1669,583

1794

27,8123

0,000000

X7

932,218

5

866,782

1794

385,8873

0,000000

X8

960,904

5

838,096

1794

411,3759

0,000000

X9

650,044

5

1148,955

1794

202,9983

0,000000

X10

7,672

5

1791,328

1794

1,5367

0,175175


Лучшему вкладу соответствуют большие значения и меньшие значения . Признаки с большими значениями (например, больше 0,05) можно исключить из процедуры классификации.
В нашем случае все рассмотренные переменные, за исключением переменной («Вероятность угона»), являются значимыми для процесса классификации (табл. 2).
> 0,05, следовательно, переменная не является значимым фактором риска по застрахованному объекту и должна быть исключена из процедуры классификации.

Табл. 2. Анализ дисперсии


Межгрупповые дисперсии

СС

Внутригрупповые дисперсии

СС

F

Значимость p

X1

783,234

5

1015,766

1794

276,6627

0,000000

X2

145,299

5

1653,701

1794

31,5252

0,000000

X3

316,542

5

1482,458

1794

76,6127

0,000000

X4

1256,387

5

542,613

1794

830,7787

0,000000

X5

194,839

5

1604,161

1794

43,5793

0,000000

X6

301,474

5

1497,526

1794

72,2317

0,000000

X7

1008,278

5

790,722

1794

457,5189

0,000000

X8

1004,026

5

794,974

1794

453,1530

0,000000

X9

743,482

5

1055,517

1794

252,7306

0,000000


Итак, все переменные являются значимыми. В каждом из 6 кластеров находятся объекты со схожим влиянием на процесс убытков.
Построим график средних и доверительных интервалов для переменных в каждом кластере (рис. 2).
Первому кластеру характерен наименьший возраст и стаж водителей ( и соответственно), а также наибольший средний убыток (). Риск ДТП () по данному кластеру один из наиболее существенных.
Во второй кластер вошли автомобили со средней стоимость свыше 800 000 руб. Данному кластеру характерен существенный средний убыток () и срок эксплуатации свыше 3 лет ().
Третий кластер характеризуется наибольшей суммой накопленного износа (), в то время как срок эксплуатации является минимальным (в основном, автомобили, входящие в данный кластер, приобретены на вторичном рынке).
Четвертому кластеру характерен, прежде всего, наибольший риск ДТП (). В данный кластер вошли водители автотранспортных средств в возрасте от 28 до 33 лет и стажем вождения до 5 лет.
В пятый кластер вошли автомобили с наибольшим сроком эксплуатации (). Возраст водителей автотранспортных средств, вошедших в данный кластер, составляет от 24 до 27 лет, стаж вождения – от 3 лет (пятый кластер характеризуется безаварийным результатом прохождения предшествующего страхового периода – так называемая, система «бонус-малус»).
Шестой кластер характеризуется наименьшей стоимостью автотранспортный средств (), наибольшим возрастом и стажем вождения страхователей ( и соответственно).

Рис. 2. График средник значений переменных

Итак, табл. 2 и рис. 2 показывают, что разбиение автотранспортных средств физических лиц на шесть однородных групп без учета параметра прошло успешно. Для каждой переменной значение -статистики показывает, что отношение межгрупповой дисперсии к внутригрупповой имеет большие значения, а значение , оценивающее вероятность равенства указанных дисперсий, меньше заданного уровня значимости . Каждая из переменных вносит значимый вклад в процесс разбиения совокупности на классы.
Далее могут быть рассмотрены показатели статистики имущественного страхования применительно к каждому из выделенных кластеров.
Кластеризация структуры портфеля автотранспортного страхования позволяет на начальных стадиях процесса андеррайтинга выявить неэффективность страхового портфеля, ошибки в тарифном руководстве.

Литература:
  1. Щуклинова М.В. Управление процессом андеррайтинга в имущественном страховании // Страховое дело. 2009. № 8. С. 43-47.
  2. Эконометрика: учебник / И.И. Елисеева, С.В. Курышева, Т.В. Костеева и др., под ред. И.И. Елисеевой. – 2-е изд., перераб. и доп. – М.: Финансы и статистика, 2008. – 576с.: ил.

Обсуждение

Социальные комментарии Cackle