Кластеризация структуры портфеля автотранспортного страхования физических лиц | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 4 мая, печатный экземпляр отправим 8 мая.

Опубликовать статью в журнале

Автор:

Рубрика: Экономика и управление

Опубликовано в Молодой учёный №1 (24) январь 2011 г.

Статья просмотрена: 692 раза

Библиографическое описание:

Атапина, Н. В. Кластеризация структуры портфеля автотранспортного страхования физических лиц / Н. В. Атапина. — Текст : непосредственный // Молодой ученый. — 2011. — № 1 (24). — С. 88-91. — URL: https://moluch.ru/archive/24/2584/ (дата обращения: 26.04.2024).

Начальная стадия методики андеррайтинга для страхования автотранспортных средств физических лиц заключается в изучении структуры страхового портфеля, его убыточности и факторов, влияющих на эффективность страхования. Проведенный анализ позволит прогнозировать показатели страхового портфеля в случае изменения его структуры. С этой целью определим кластеры по совокупности значимых взаимонезависимых факторов риска в соответствии с разбросом цен на рынке автотранспортных средств и статистикой страховой компании (условный пример).
Исследование рисков по автотранспортным средствам позволило выделить 10 факторов, отражающих состояние и условия эксплуатации застрахованных объектов:
– стоимость автомобиля;
– средний убыток по объекту;
– срок эксплуатации;
– износ;
– мощность;
– масса автомобиля;
– возраст водителя;
– стаж водителя;
– риск ДТП;
– вероятность угона.
Фактор («Износ») определен на основе «Методического руководства по определению стоимости автотранспортных средств с учетом естественного износа и технического состояния на момент предъявления» (РД 37.009.015/98 с изменениями №1, №2, №3, №4, №5, №6), утвержденного Минэкономики РФ 04.06.1998 г.
Фактор («Риск ДТП») определен на основании исследований, выполненных в научно-исследовательском центре РОСДОРНИИ для различных типов дорог в зависимости от коэффициента их загрузки, в том числе: многополосные и двухполосные дороги в населенных пунктах и вне населенных пунктов, с разделительной полосой и без нее, а также внутрипостроечные и грунтовые дороги [1].
Последний фактор установлен в соответствии со статистикой по угонам автомобилей в Российской Федерации в 2010 г. (в соответствии с данными МВД РФ).
Перейдем непосредственно к структуризации базового страхового портфеля с помощью кластерного анализа с учетом определенных выше факторов (10 факторов). Кластерный анализ выполнен с использованием пакета программ STASTICA, предназначенного для обработки статистических данных.
Базовый страховой портфель автотранспортного страхования физических лиц в 2010 г. включает следующие основные параметры страхования: 1 800 машин (договоров), совокупная страховая премия составила 54 844 430 руб., средняя страховая выплата – 26 000 руб.
На первом этапе кластерного анализа портфеля автотранспортного страхования физических лиц необходимо стандартизовать исходные данные, так чтобы каждая переменная имела среднее 0 и стандартное отклонение 1, и выяснить, формируют ли автомобили «естественные» кластеры, которые могут быть осмыслены.
В качестве правила объединения выберем метод Уорда, в качестве меры близости – евклидово расстояние.
Метод Уорда предполагает, что каждый объект – это отдельный кластер. Рассчитывается расстояние между объектами и в кластер объединяются наиболее «близкие» объекты. Метод Уорда приводит к образованию кластеров приблизительно равных размеров с минимальной внутрикластерной дисперсией [2].
Мера близости, определяемая евклидовым расстоянием, является геометрическим расстоянием в -мерном пространстве и вычисляется по формуле 1:

Врезка1


где – евклидово расстояние между -тым и -тым объектами;
– численное значение -той переменной для -того объекта;
– численное значение -той переменой для -того объекта;
– количество переменных, которыми описываются объекты.
Наиболее важным результатом, получаемым в результате кластеризации, является иерархическое дерево – дендрограмма (рис. 1).
Каждый узел дендрограммы представляет объединение двух или более кластеров, положение узлов на вертикальной оси определяет расстояние, на котором были объединены соответствующие кластеры.

Рис. 1. Дендрограмма объединения объектов (1 800 наблюдений)

Приведенная дендрограмма показывает, что наиболее оптимальным (чаще повторяющимся и имеющим достаточно прозрачную интерпретацию) является разбиение автомобилей на 6 «естественных» кластеров. Уточнение и оценку качества разбиения объектов на кластеры продолжим методом -средних (второй этап кластерного анализа).
Суть метода -средних состоит в исследовании заранее определенного количества классов , на которые необходимо разбить имеющиеся наблюдения, и начальных центров этих классов. Для каждого следующего наблюдения рассчитываются расстояния до центров кластеров, и данное наблюдение относится к тому кластеру, расстояние до которого было минимальным. После этого для данного кластера (в котором увеличилось количество наблюдений) рассчитывается новый центр тяжести (как среднее по каждому показателю) по всем включенным в кластер наблюдениям.
Разобьем исходные данные методом -средних на 6 кластеров и проверим значимость различия между полученными группами (табл. 1).
Значения межгрупповой и внутригрупповой дисперсии определяют «качество» кластеризации, насколько хорошо конкретный признак характеризует принадлежность объектов к кластеру.
Параметры и характеризуют вклад признака в разделение объектов на группы. В столбце «» приводится значение -критерия, используемого для проверки гипотезы о равенстве дисперсий признаков между кластерами и внутри кластеров, вероятность ошибки при принятии гипотезы о неравенстве дисперсий.

Табл. 1. Анализ дисперсии


Межгрупповые дисперсии

СС

Внутригрупповые дисперсии

СС

F

Значимость p

X1

784,248

5

1014,752

1794

277,2975

0,000000

X2

626,743

5

1172,257

1794

191,8312

0,000000

X3

263,356

5

1535,643

1794

61,5327

0,000000

X4

1253,217

5

545,783

1794

823,8699

0,000000

X5

141,896

5

1657,104

1794

30,7237

0,000000

X6

129,417

5

1669,583

1794

27,8123

0,000000

X7

932,218

5

866,782

1794

385,8873

0,000000

X8

960,904

5

838,096

1794

411,3759

0,000000

X9

650,044

5

1148,955

1794

202,9983

0,000000

X10

7,672

5

1791,328

1794

1,5367

0,175175


Лучшему вкладу соответствуют большие значения и меньшие значения . Признаки с большими значениями (например, больше 0,05) можно исключить из процедуры классификации.
В нашем случае все рассмотренные переменные, за исключением переменной («Вероятность угона»), являются значимыми для процесса классификации (табл. 2).
> 0,05, следовательно, переменная не является значимым фактором риска по застрахованному объекту и должна быть исключена из процедуры классификации.

Табл. 2. Анализ дисперсии


Межгрупповые дисперсии

СС

Внутригрупповые дисперсии

СС

F

Значимость p

X1

783,234

5

1015,766

1794

276,6627

0,000000

X2

145,299

5

1653,701

1794

31,5252

0,000000

X3

316,542

5

1482,458

1794

76,6127

0,000000

X4

1256,387

5

542,613

1794

830,7787

0,000000

X5

194,839

5

1604,161

1794

43,5793

0,000000

X6

301,474

5

1497,526

1794

72,2317

0,000000

X7

1008,278

5

790,722

1794

457,5189

0,000000

X8

1004,026

5

794,974

1794

453,1530

0,000000

X9

743,482

5

1055,517

1794

252,7306

0,000000


Итак, все переменные являются значимыми. В каждом из 6 кластеров находятся объекты со схожим влиянием на процесс убытков.
Построим график средних и доверительных интервалов для переменных в каждом кластере (рис. 2).
Первому кластеру характерен наименьший возраст и стаж водителей ( и соответственно), а также наибольший средний убыток (). Риск ДТП () по данному кластеру один из наиболее существенных.
Во второй кластер вошли автомобили со средней стоимость свыше 800 000 руб. Данному кластеру характерен существенный средний убыток () и срок эксплуатации свыше 3 лет ().
Третий кластер характеризуется наибольшей суммой накопленного износа (), в то время как срок эксплуатации является минимальным (в основном, автомобили, входящие в данный кластер, приобретены на вторичном рынке).
Четвертому кластеру характерен, прежде всего, наибольший риск ДТП (). В данный кластер вошли водители автотранспортных средств в возрасте от 28 до 33 лет и стажем вождения до 5 лет.
В пятый кластер вошли автомобили с наибольшим сроком эксплуатации (). Возраст водителей автотранспортных средств, вошедших в данный кластер, составляет от 24 до 27 лет, стаж вождения – от 3 лет (пятый кластер характеризуется безаварийным результатом прохождения предшествующего страхового периода – так называемая, система «бонус-малус»).
Шестой кластер характеризуется наименьшей стоимостью автотранспортный средств (), наибольшим возрастом и стажем вождения страхователей ( и соответственно).

Рис. 2. График средник значений переменных

Итак, табл. 2 и рис. 2 показывают, что разбиение автотранспортных средств физических лиц на шесть однородных групп без учета параметра прошло успешно. Для каждой переменной значение -статистики показывает, что отношение межгрупповой дисперсии к внутригрупповой имеет большие значения, а значение , оценивающее вероятность равенства указанных дисперсий, меньше заданного уровня значимости . Каждая из переменных вносит значимый вклад в процесс разбиения совокупности на классы.
Далее могут быть рассмотрены показатели статистики имущественного страхования применительно к каждому из выделенных кластеров.
Кластеризация структуры портфеля автотранспортного страхования позволяет на начальных стадиях процесса андеррайтинга выявить неэффективность страхового портфеля, ошибки в тарифном руководстве.

Литература:
  1. Щуклинова М.В. Управление процессом андеррайтинга в имущественном страховании // Страховое дело. 2009. № 8. С. 43-47.
  2. Эконометрика: учебник / И.И. Елисеева, С.В. Курышева, Т.В. Костеева и др., под ред. И.И. Елисеевой. – 2-е изд., перераб. и доп. – М.: Финансы и статистика, 2008. – 576с.: ил.
Основные термины (генерируются автоматически): кластер, риск ДТП, срок эксплуатации, автотранспортное страхование, евклидово расстояние, кластерный анализ, метод - средних, переменная, средство, страховой портфель.


Похожие статьи

Оценка рисков информационной безопасности с помощью метода...

Евклидово расстояние между точкой данных X = (x1, x2, …, xd) в степени t и центр кластера C = c1, c2, …, cd) в степени t

К-means алгоритм кластеризации является одной из основных алгоритмов кластерного анализа, которые используют итерационный метод для обновления.

Применение иерархического кластерного анализа для...

Методом исследования являлся иерархический кластерный анализ, с применением метода Варда.

При его использовании кластеры формируют таким образом, чтобы минимизировать квадраты евклидовых расстояний до кластерных средних.

Поэтапный процесс кластерного анализа данных на основе...

Рассмотрим один из самых популярных и широко используемых методов кластерного анализа — алгоритм k–means (k–средних).

Евклидово расстояние является геометрическим расстоянием в многомерном пространстве и вычисляется по формуле

Сбалансированность страхового портфеля: действующая...

Согласно мнению Н. М. Яшиной, «Страховой портфель — это стоимость страховых рисков, принятых на страхование с набором определенных финансовых инструментов, обеспечивающих финансовую устойчивость страховой организации...

Оценка критического срока эксплуатации оборудования опасных...

Кластерный анализ является сопутствующим количественным методом системного анализа.

Объединение в кластеры проводится на основе минимального расстояния в евклидовом пространстве.

Применение методов кластеризации для обработки новостного...

Расстояние от новой статьи до кластера высчитывается как среднее арифметическое расстояний до всех статей кластера.

Кондратьев М.Е. Анализ методов кластеризации новостного потока.

Метод естественной кластеризации данных | Статья в журнале...

В настоящее время существует большее количество разнообразных методов кластерного анализа.

Однако использование различных метрик, особенно таких распространенных как евклидово расстояние, степенное расстояние и т. д., может приводить к некорректным...

Страхование как метод минимизации рисков при транспортировке

Страхование — система мероприятий по созданию страхового фонда за счет взносов его участников, из средств которого возмещается ущерб

Современные методы минимизации кредитных рисков. Страхование банковских рисков в России: тенденции и перспективы.

Совершенствование оценки страховой стоимости недвижимого...

Ключевые слова: страхование, оценочная деятельность, страховая стоимость, методы оценки страховой стоимости, корреляционно-регрессионный анализ.

Содержание переменной. Total S. Общая площадь квартиры, кв. м. Distance from the center. Удаленность от центра города, км.

Похожие статьи

Оценка рисков информационной безопасности с помощью метода...

Евклидово расстояние между точкой данных X = (x1, x2, …, xd) в степени t и центр кластера C = c1, c2, …, cd) в степени t

К-means алгоритм кластеризации является одной из основных алгоритмов кластерного анализа, которые используют итерационный метод для обновления.

Применение иерархического кластерного анализа для...

Методом исследования являлся иерархический кластерный анализ, с применением метода Варда.

При его использовании кластеры формируют таким образом, чтобы минимизировать квадраты евклидовых расстояний до кластерных средних.

Поэтапный процесс кластерного анализа данных на основе...

Рассмотрим один из самых популярных и широко используемых методов кластерного анализа — алгоритм k–means (k–средних).

Евклидово расстояние является геометрическим расстоянием в многомерном пространстве и вычисляется по формуле

Сбалансированность страхового портфеля: действующая...

Согласно мнению Н. М. Яшиной, «Страховой портфель — это стоимость страховых рисков, принятых на страхование с набором определенных финансовых инструментов, обеспечивающих финансовую устойчивость страховой организации...

Оценка критического срока эксплуатации оборудования опасных...

Кластерный анализ является сопутствующим количественным методом системного анализа.

Объединение в кластеры проводится на основе минимального расстояния в евклидовом пространстве.

Применение методов кластеризации для обработки новостного...

Расстояние от новой статьи до кластера высчитывается как среднее арифметическое расстояний до всех статей кластера.

Кондратьев М.Е. Анализ методов кластеризации новостного потока.

Метод естественной кластеризации данных | Статья в журнале...

В настоящее время существует большее количество разнообразных методов кластерного анализа.

Однако использование различных метрик, особенно таких распространенных как евклидово расстояние, степенное расстояние и т. д., может приводить к некорректным...

Страхование как метод минимизации рисков при транспортировке

Страхование — система мероприятий по созданию страхового фонда за счет взносов его участников, из средств которого возмещается ущерб

Современные методы минимизации кредитных рисков. Страхование банковских рисков в России: тенденции и перспективы.

Совершенствование оценки страховой стоимости недвижимого...

Ключевые слова: страхование, оценочная деятельность, страховая стоимость, методы оценки страховой стоимости, корреляционно-регрессионный анализ.

Содержание переменной. Total S. Общая площадь квартиры, кв. м. Distance from the center. Удаленность от центра города, км.

Задать вопрос