Применение вектора Шепли и индекса Банзафа для определения значимости генов при болезни Альцгеймера | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 30 ноября, печатный экземпляр отправим 4 декабря.

Опубликовать статью в журнале

Библиографическое описание:

Бузмаков, Г. А. Применение вектора Шепли и индекса Банзафа для определения значимости генов при болезни Альцгеймера / Г. А. Бузмаков, Д. В. Горбачев, К. И. Николаев, Т. Э. Азизов. — Текст : непосредственный // Молодой ученый. — 2019. — № 24 (262). — С. 79-82. — URL: https://moluch.ru/archive/262/60698/ (дата обращения: 16.11.2024).



Введение. Процесс преобразования наследственной информации от гена в РНК или белок называется экспрессией генов. Каждая клетка транскрибирует различные гены в виде молекулы РНК в соответствии с типом клетки, биологическими процессами, нормальным или патологическим состоянием и т. д. Разнообразие в профилях генной экспрессии интенсивно изучается ввиду его биологического и клинического значения.

Целью данной работы является решение проблемы определения относительной значимости генов при патогенезе болезни Альцгеймера, используя данные, полученные с помощью технологии микрочипов, с учетом уровня взаимодействия между генами.

Обзор литературы. Сегодня есть возможность одновременно отслеживать экспрессию десятков тысяч генов благодаря технологии микрочипов, впервые использованной в конце 1980-х годов. Полученные данные могут быть использованы для выявления генов, отвечающих за конкретное заболевание.

В литературе представлено большинство моделей для анализа данных: вывода из матрицы данных экспрессии генов, роли генов, их взаимодействий и их поведения при изменении состояния биологической системы. Кроме аналитических методов также может использоваться теория кооперативных игр. В [1] введен класс игр с микрочипами, позволяющий количественно оценить значимость каждого гена в патогенезе генетического заболевания, представляющего интерес, с учетом наблюдаемых взаимосвязей во всех подгруппах генов и обосновано использование вектора Шепли для ранжирования генов. В [2] предложено множество свойств, характеризующих индекс Банзафа, и доказана правомерность его использования для вычисления индекса значимости генов.

Математическая модель. Основная идея данной модели заключается в применении теории кооперативных игр, где в роли игроков выступают гены. Пусть множество генов, и , соответственно, множества образцов клеток из здоровых тканей и тканей с генетическим заболеванием.

Задача экспериментов с микрочипами состоит в сопоставлении каждому образцу профиль экспрессии , где —величина экспрессии гена в образце . Вместе эти значения называются набором данных эксперимента микрочипов и могут быть представлены в форме двух матриц и , где столбцы — это профили экспрессии образцов. Пусть — микрочиповая экспериментальная ситуация (МЭС).

Для начала необходимо определить, экспрессия каких генов из больных клеток выражается аномально по отношению к экспрессии генов из здоровых. Так строим булевый профиль экспрессии , элементы которого принимают значение , если ген выражен аномально, и — в противном случае. Отображение , присваивающее каждому профилю экспрессии из больных образцов соответствующий булевый профиль экспрессии, называется дискриминантным методом. В итоге получаем булевую матрицу экспрессии .

Микрочиповая игра — это кооперативная игра , где

конечное множество генов в роли игроков,

— характеристическая функция, присваивающая каждой коалиции среднее значение количества образцов с интересующей нас болезнью

где , а — опора вектора.

Класс микрочиповых игр обозначим символом ℳ.

Простой игрой будем называть игру на , где если , и — в противном случае.

Любая кооперативная игра может быть записана в виде линейной комбинации единогласных игр:

где — коэффициент единогласия, а .

Через коэффициенты единогласия игры могут быть даны модифицированные представления вектора Шепли

и индекса Банзафа

которые обладают свойствами, соответствующими биологическим законам.

Индексом значимости — это решение в классе микрочиповых игр с набором генов в качестве множества игроков. В контексте микрочиповых игр, решение рассматривается как вектор ранжирования силы генов, то есть ген получивший наибольший «выигрыш» является наисильнейшим в данной выборке и так далее.

Результаты. Возьмем посмертные данные микрочипов из тканей лобной и височной коры головного мозга, а также гиппокампа у пациентов с наличием болезни Альцгеймера или другой сосудистой деменции.Эти данные находятся в открытом доступе [3]. За больные образцы взяты образцы тканей с болезнью Альцгеймера, за «здоровые» — образцы с другой деменцией.

Рассмотрим МЭС , где , . Получаем следующие данные. При использовании индекса Банзафа многие гены получили одинаковый индекс значимости (рис. 1), что обусловлено слишком большим значением, стоящим в знаменателе при вычислении индекса Банзафа, а именно , где — мощность коалиции, в то время, как в знаменателе вектора Шепли стоит просто . Первые 10 генов по убыванию индекса значимости, вычисленному с помощью вектора Шепли, представлены в таблице 1.

Таблица 1

Первые 10 генов по индексу значимости, посчитанному спомощью вектора Шепли, умужчин иженщин вместе ипо отдельности

Мужчины иЖенщины

Мужчины

Женщины

Ген

Ген

Ген

RYR1

1,42125

ACAA1

0,87529

ZC3H11A

1,40275

HYDIN2

1,3214

HNRNPA3P1

0,79922

CCDC190

1,39448

FAHD2B

1,31450

MMAB

0,79355

ALDH2

1,19962

GALNT15

1,27645

TDH

0,7922

AF074983

1,10729

ECHDC2

1,17365

NINL

0,78509

RHBDD1

1,08732

PLEC

1,16275

TDRD3

0,78163

ARHGEF10

1,07735

PFDN5

1,14733

WDR49

0,77295

AK023372

1,02686

ZC3H11A

1,13735

ZNF185

0,77011

ZNF761

0,99062

NDUFS6

1,1145

PFDN5

0,76712

ADGRA3

0,98517

WDR49

1,08939

ZNF844

0,76267

RYR1

0,98269

Глобально разница в результатах представлена на левом графике (рис. 1), по вертикали стоит значение индекса значимости, а по горизонтали — ранг гена, вычисленного с помощью вектора Шепли. На правом графике показано, что при уменьшении количества рассматриваемых генов с 4033 до 15 уменьшается и разница в рангах генов, найденных двумя разными способами, что говорит о возможности использования индекса Банзафа для вычисления индекса значимости при небольшом количестве генов.

Рис. 1. Разница в индексах значимости генов, полученных с помощью вектора Шепли и индекса Банзафа для 4033 и 15 генов

Доказано, что у мужчин и женщин болезнь Альцгеймера протекает по-разному. Рассмотрим еще две МЭС для мужчин и для женщин. В таблице 2 так же представлены первые 10 позиций по индексу значимости, посчитанного с помощью вектора Шепли отдельно для мужчин и женщин.

Многие полученные результаты подтверждены современными научными публикациями: например, влияние генов RYR1 и ALDH2 на процесс болезни Альцгеймера описано в [4] и [5], роль шаперонов в патогенезе болезни Альцгеймера, в комплекс которых входит ген PFDN5, описана в [6]. Также выявлены гены, которые могут играть ключевую роль при патогенезе этой болезни, но еще не рассмотренные в научной литературе.

Вывод. Результатом использования рассмотренного подхода является распределение вектора решения, примененного к микрочиповой игре. Данный подход представляет интерес для генетического анализа и предлагает новый математический подход для данной области.

Литература:

  1. Moretti S., Patrone F., Bonassi S. The class of microarray games and the relevance index for genes // TOP. 2007. No 15. P. 256–280.
  2. Lucchetti R., Moretti S., Patrone F., Radrizzani P. The Shapley and Banzhaf value in microarray games. // Computers & Operations Research 37. 2010. P. 1406–1412.
  3. The National Center for Biotechnology Information. https://www.ncbi.nlm.nih.gov/geo/gds/analyze/analyze.cgi?ID=GDS4758.
  4. Chami M., Checler F. Ryanodine receptors: dual contribution to Alzheimer disease? // Channels (Austin). 2014. P. 168–168.
  5. Ma L., Lu Z. N. Role of ADH1B rs1229984 and ALDH2 rs671 gene polymorphisms in the development of Alzheimer’s disease // Genet. Mol. Res. 2016. Vol. 15. No 4. P. 1–8.
  6. Loke S. Y., Wong P. T., Ong W. Y. Global gene expression changes in the prefrontal cortex of rabbits with hypercholesterolemia and/or hypertension // J. Mol. Neurosci. 2007. No 102. P. 33–56.
Основные термины (генерируются автоматически): ген, помощь вектора, профиль экспрессии, игра, индекс значимости, MMAB, NINL, генетическое заболевание, кооперативная игра, противный случай.


Похожие статьи

Применение и модификация алгоритма Вагнера — Фишера нахождения расстояния Левенштейна в проблеме распознавания фраз

Клиника и генетика хромосомных болезней, связанных с изменением числа половых хромосом, на примере синдромов Клайнфельтера и Шерешевского — Тернера

Применение модели градиентного бустинга для прогнозирования развития диабета

Использование эвристического метода при изучении темы «Величины, характеризующие колебательное движение»

Применение модели линейного предсказания для анализа стохастических сигналов

Использование метода Лоури для количественного определения белка в альбумине

Метод линеаризации для задач условной оптимизации. Алгоритм Франка-Вульфа

Применение моделей Васичека для прогнозирования базовых ставок в Казахстане

Использование нейропсихологических технологий для коррекции смешанной дисграфии у детей младшего школьного возраста

Алгоритм Лерча — Гроссмана и его реализация на центральном и графическом процессорах

Похожие статьи

Применение и модификация алгоритма Вагнера — Фишера нахождения расстояния Левенштейна в проблеме распознавания фраз

Клиника и генетика хромосомных болезней, связанных с изменением числа половых хромосом, на примере синдромов Клайнфельтера и Шерешевского — Тернера

Применение модели градиентного бустинга для прогнозирования развития диабета

Использование эвристического метода при изучении темы «Величины, характеризующие колебательное движение»

Применение модели линейного предсказания для анализа стохастических сигналов

Использование метода Лоури для количественного определения белка в альбумине

Метод линеаризации для задач условной оптимизации. Алгоритм Франка-Вульфа

Применение моделей Васичека для прогнозирования базовых ставок в Казахстане

Использование нейропсихологических технологий для коррекции смешанной дисграфии у детей младшего школьного возраста

Алгоритм Лерча — Гроссмана и его реализация на центральном и графическом процессорах

Задать вопрос