Во всем мире огромное количество людей страдает от болезней и проблем со здоровьем. Большинство заболеваний достаточно легко обнаруживаются и диагностируется врачами, однако ряд самых опасных из них тяжело поддается описанию, что приводит к трудностям их надлежащего лечения. Последние десятилетия характеризуются быстрыми темпами развития медицины, что привело к значительному расширению знаний закономерностей функционирования человеческого организма, появлению новых методов обследования и лечения больных. В то же время, все это привело к увеличению объема информации, необходимой для врачей в их практической деятельности для диагностики и лечения заболеваний.
Сегодня, несмотря на достижения современной компьютерной диагностики, всё еще сохраняется высокая тенденция смертности (более 50 %) от сердечно-сосудистых заболеваний из-за несвоевременного и неточного [1]. Проблема усугубляется тем фактом, что ряд демографических и экологических факторов, таких как увеличение доли пожилого населения, изменение климата, загрязнение окружающей среды и т. д., привели к тому, что врачи все чаще имеют дело не с одной болезнью пациента, а с их комбинациями. В результате появляется необходимость увеличения количества взаимозависимых показателей активности организма, что еще более усложняет проблему выбора адекватных лечебных воздействий.
Практическая медицина по-прежнему трудно формализуемая область человеческой деятельности, в которой эксперты при принятии решений часто исходят из предыдущего профессионального опыта и собственной интуиции, а не из анализа объективных данных. В такой ситуации трудно избежать врачебных ошибок, социальное и экономическое значение которых чрезвычайно высоко [1]. В решении сложившейся проблемы сегодня широко применяются методы интеллектуального анализа «больших» данных, одним из которых выступает нейросетевое моделирование. В связи с этим, целью данного исследования являлось рассмотрение влияния факторов здоровья человека на выявление диастолической дисфункции левого желудочка у больных пожилого и старческого возраста на основе многослойных нейронных сетей.
Диастолическая дисфункция левого желудочка (ДДЛЖ) — это нарушение нормального процесса заполнения желудочка кровью во время периода расслабления сердца (диастолы). Этот вид патологии, как правило, развивается в пожилом возрасте, чаще у женщин. Диагностика на ранних этапах позволяет предотвратить необратимые изменения. Одним из наиболее популярных и доступных информативных методов диагностики ДДЛЖ является двухмерная эхокардиография с допплерографией [2].
В качестве показателей здоровья в исследовании рассмотрены 56 параметров, включающих группу из общих показателей, эхокардиографического исследования и основных факторов риска. Часть включенных в исследование показателей представляла собой зависимые параметры, что позволило рассмотреть парное воздействие критериев на изучаемый процесс.
С целью выявления наиболее значимых критериев для ДДЛЖ был осуществлен корреляционный анализ, выражающий прочность отношений между двумя переменными. Высокая корреляция означает, что две или более переменные имеют сильную связь друг с другом, в то время как слабая или низкая корреляция означает, что переменные практически не связаны между собой. Корреляционный анализ представляет собой процесс изучения прочности этих отношений с имеющимися статистическими данными.
Коэффициенты корреляции могут варьироваться от -1.00 (идеальная отрицательная корреляция) до +1.00 (идеальная положительная корреляция). Значение равное или близкое к 0.00 означает отсутствие связи между параметрами. Для анализа корреляции изучаемого патологического состояния использовалась обучающая выборка данных, содержащая результаты 457 эхокардиографических исследований. Критерии с коэффициентом корреляции от -0.10 до +0.10 были исключены из обучающей выборки как малозначимые. Таковыми критериями оказались: возраст пациента (-0.05), рост (-0.07), постинфарктный кардиосклероз (-0.01), аортокоронарное шунтирование (-0.07), артериальная гипертензия (0.08), хроническая почечная недостаточность (-0.09), наличие подагры (0.00), антагонисты кальция (-0.01), прием нитратов (-0.09), частота сердечных сокращений (-0.02), наджелудочковая экстрасистолия (-0.04), желудочковая экстрасистолия (0,00), липопротеиды высокой плотности (0.02), диаметр аорты (0,04), фракция выброса (-0,09), размер правого желудочка (0,07).
К значимым параметрам были отнесены следующие: пол (0,19), вес (0,16), индекс массы тела (0,15), функциональный класс стенокардии (0,14), стентирование коронарных артерий (-0,16), каротидная эндартерэктомия (0,61), хроническая сердечная недостаточность (-0,39), NYHA (-0,32), сахарный диабет (0,27), курение (0,24), дислипидемия (-0,11), положительный семейный анамнез (0,21), периферический атеросклероз (0,27), инсульт (0,29), дисциркуляторная энцефалопатия (-0,44), остеохондроз (-0,41), заболевания желудочно-кишечного тракта (-0,57), ингибиторы АПФ, блокаторы ангиотензиновых рецепторов (0,28), статины (0,28), аспирин (0,21), ритм синусовый (0,17), искусственный водитель ритма сердца (-0,12), мерцательная аритмия (-0,17), систолическое артериальное давление (0,12), диастолическое артериальное давление (0,19), уровень глюкозы в крови (0,13), общий холестерин (-0,38), липопротеиды низкой плотности (-0,38), индекс атерогенности (-0,32), коэффициент атерогенности (-0,37), степень каротидного стеноза (0,47), тип атеросклеротической бляшки (0,25), конечно-диастолический размер ЛЖ (-0,15), конечно-диастолический объем ЛЖ (-0,31), диаметр левого предсердия (0,23), конечно-систолический размер ЛЖ (-0,27), конечно-систолический объем ЛЖ (-0,26), толщина межжелудочковой перегородки (0,52), ударный объем сердца (-0,29), толщина задней стенки ЛЖ (0,59). Данные параметры были включены в обучающую выборку при моделировании многослойной нейронной сети.
Искусственная нейронная сеть — это совокупность моделей биологических нейронных сетей. Она представляет собой сеть элементов — искусственных нейронов, связанных между собой синаптическими соединениями. Сеть обрабатывает входную информацию и в процессе изменения своего состояния во времени формирует совокупность выходных сигналов. Работа сети состоит в преобразовании входных сигналов во времени, в результате чего меняется внутреннее состояние сети и формируются выходные воздействия. Большинство моделей нейронных сетей требуют обучения. В общем случае, обучение — такой выбор параметров сети, при котором сеть лучше всего справляется с поставленной проблемой. Обучение — это задача многомерной оптимизации, и для ее решения существует множество алгоритмов [3]. В данном исследовании для изучения выбран алгоритм обратного распространения ошибки.
Алгоритм обратного распространения ошибки — это один из методов обучения многослойных нейронных сетей прямого распространения, которые ещё называют многослойными персептронами [4]. Обучение алгоритмом обратного распространения ошибки предполагает два прохода по всем слоям сети: прямого и обратного. При прямом проходе входной вектор подается на входной слой нейронной сети, после чего распространяется по сети от слоя к слою. В результате генерируется набор выходных сигналов, который и является фактической реакцией сети на данный входной образ. Во время прямого прохода все синаптические веса сети фиксированы. Во время обратного прохода все синаптические веса настраиваются в соответствии с правилом коррекции ошибок, а именно: фактический выход сети вычитается из желаемого, в результате чего формируется сигнал ошибки. Этот сигнал впоследствии распространяется по сети в направлении, обратном направлению синаптических связей [5].
В исследовании в качестве функций активации нейрона применялись:
– Сигмоидная функция в виде гиперболического тангенса (tansig) — ;
– Логарифмическая сигмоидная функция активации (logsig) — .
Модели нейронной сети включали один или два скрытых слоя со следующим количеством нейронов и структурой функций активации:
– n-5–1 (tansig-tansig, logsig-tansig);
– n-10–1 (tansig-tansig, logsig-tansig);
– n-15–1 (tansig-tansig, logsig-tansig);
– n-20–1 (tansig-tansig, logsig-tansig);
– n-15–5-1 (logsig-tansig-tansig, tansig-tansig-tansig).
где n — это число входных нейронов. В нашем случае выявлено 40 значимых параметров, а, значит, таким будет и количество входов (n=40). Выходной нейрон настроен на отображение результата между 0.00 (патология не выявлена) и 1.00 (патология обнаружена).
В обучении нейронной сети применялись следующие настройки:
– Максимальное число итераций — 2000;
– Разделение данных (на обучающую и проверяющую часть) — случайное;
– Алгоритм — градиентный спуск с обратным распространением ошибки;
– Погрешность — среднеквадратичная ошибка;
– Минимальный градиент — 0.000005;
– Максимальное число валидаций — 500.
В результате обучения и тестирования моделей получены следующие сравнительные результаты (Таблица 1):
Таблица 1
Сравнительная таблица результатов тестирования исследованных моделей нейронных сетей
Ответы эксперта |
0,0000 |
1,0000 |
0,0000 |
0,0000 |
1,0000 |
0,0000 |
0,0000 |
1,0000 |
1,0000 |
0,0000 |
Tansig-tansig: 40–5-1 |
0,0000 |
0,9958 |
0,9999 |
0,4202 |
0,9038 |
0,0032 |
0,0838 |
0,8025 |
0,9965 |
0,5010 |
Tansig-tansig: 40–10–1 |
0,0003 |
0,9976 |
0,9991 |
0,0006 |
0,9061 |
0,0026 |
0,0012 |
0,9012 |
0,9984 |
0,4303 |
Tansig-tansig: 40–15–1 |
0,0003 |
0,9972 |
0,9974 |
0,0007 |
0,9968 |
0,0026 |
0,1764 |
0,8919 |
0,9987 |
0,2002 |
Tansig-tansig: 40–20–1 |
0,0006 |
0,9976 |
0,9991 |
0,0010 |
0,9517 |
0,0040 |
0,1087 |
0,9320 |
0,9976 |
0,4204 |
Logsig-tansig: 40–20–1 |
0,0000 |
0,9957 |
0,9995 |
0,0004 |
0,9364 |
0,0039 |
0,0039 |
0,9229 |
0,9977 |
0,9005 |
Logsig-tansig: 40–15–1 |
0,0000 |
0,9935 |
0,9994 |
0,0021 |
0,9283 |
0,0042 |
0,1402 |
0,7825 |
0,9939 |
0,7639 |
Logsig-tansig: 40–10–1 |
0,0002 |
0,9967 |
0,9997 |
0,0001 |
0,9480 |
0,2103 |
0,1049 |
0,9843 |
0,9976 |
0,7219 |
Logsig-tansig: 40–5-1 |
0,0000 |
0,9950 |
0,9984 |
0,0011 |
0,9569 |
0,0021 |
0,0834 |
0,8904 |
0,9954 |
0,9815 |
Logsig-tansig-tansig: 40–15–5-1 |
0,0014 |
0,9938 |
0,9997 |
0,0021 |
0,9376 |
0,0102 |
0,1352 |
0,4065 |
0,9914 |
0,9052 |
Tansig-tansig-tansig: 40–15–5-1 |
0,0013 |
0,9959 |
0,9979 |
0,0072 |
0,9777 |
0,0053 |
0,1796 |
0,5051 |
0,9910 |
0,8921 |
Эксперимент показал, что для изучаемого процесса наиболее достоверные результаты получены в нейронных моделях с одним скрытым слоем с сигмоидной функцией активации в виде гиперболического тангенса. При этом важно отметить, что модель с пятнадцатью нейронами в скрытом слое показала наилучшие результаты тестирования. Остальные модели были менее точны или имели значительные погрешности в выходных значениях. Подобные результаты могут говорить о том, что изменение количества скрытых слоев и нейронов в них ведет к изменению графика функции, получаемой с помощью нейронной сети, что изменяет область выдаваемых ею выходных значений.
Литература:
- Розыходжаева Д. А., магистерская диссертация «Моделирование процессов принятия решений в современной эхокардиографии», г.Ташкент, 2016
- http://www.infmedserv.ru/stati/diastolicheskaya-disfunkciya-levogo-zheludochka
- Заенцев И. В. «Нейронные сети: основные модели», г.Воронеж: ВГУ, 1999
- Уоссермен Ф., «Нейрокомпьютерная техника. Теория и практика», М, Мир: 1992.
- http://www.aiportal.ru/articles/neural-networks/back-propagation