Применение вектора Шепли и индекса Банзафа для определения значимости генов при болезни Альцгеймера | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 21 декабря, печатный экземпляр отправим 25 декабря.

Опубликовать статью в журнале

Библиографическое описание:

Бузмаков Г. А., Горбачев Д. В., Николаев К. И., Азизов Т. Э. Применение вектора Шепли и индекса Банзафа для определения значимости генов при болезни Альцгеймера // Молодой ученый. — 2019. — №24. — С. 79-82. — URL https://moluch.ru/archive/262/60698/ (дата обращения: 08.12.2019).



Введение. Процесс преобразования наследственной информации от гена в РНК или белок называется экспрессией генов. Каждая клетка транскрибирует различные гены в виде молекулы РНК в соответствии с типом клетки, биологическими процессами, нормальным или патологическим состоянием и т. д. Разнообразие в профилях генной экспрессии интенсивно изучается ввиду его биологического и клинического значения.

Целью данной работы является решение проблемы определения относительной значимости генов при патогенезе болезни Альцгеймера, используя данные, полученные с помощью технологии микрочипов, с учетом уровня взаимодействия между генами.

Обзор литературы. Сегодня есть возможность одновременно отслеживать экспрессию десятков тысяч генов благодаря технологии микрочипов, впервые использованной в конце 1980-х годов. Полученные данные могут быть использованы для выявления генов, отвечающих за конкретное заболевание.

В литературе представлено большинство моделей для анализа данных: вывода из матрицы данных экспрессии генов, роли генов, их взаимодействий и их поведения при изменении состояния биологической системы. Кроме аналитических методов также может использоваться теория кооперативных игр. В [1] введен класс игр с микрочипами, позволяющий количественно оценить значимость каждого гена в патогенезе генетического заболевания, представляющего интерес, с учетом наблюдаемых взаимосвязей во всех подгруппах генов и обосновано использование вектора Шепли для ранжирования генов. В [2] предложено множество свойств, характеризующих индекс Банзафа, и доказана правомерность его использования для вычисления индекса значимости генов.

Математическая модель. Основная идея данной модели заключается в применении теории кооперативных игр, где в роли игроков выступают гены. Пусть множество генов, и , соответственно, множества образцов клеток из здоровых тканей и тканей с генетическим заболеванием.

Задача экспериментов с микрочипами состоит в сопоставлении каждому образцу профиль экспрессии , где —величина экспрессии гена в образце . Вместе эти значения называются набором данных эксперимента микрочипов и могут быть представлены в форме двух матриц и , где столбцы — это профили экспрессии образцов. Пусть — микрочиповая экспериментальная ситуация (МЭС).

Для начала необходимо определить, экспрессия каких генов из больных клеток выражается аномально по отношению к экспрессии генов из здоровых. Так строим булевый профиль экспрессии , элементы которого принимают значение , если ген выражен аномально, и — в противном случае. Отображение , присваивающее каждому профилю экспрессии из больных образцов соответствующий булевый профиль экспрессии, называется дискриминантным методом. В итоге получаем булевую матрицу экспрессии .

Микрочиповая игра — это кооперативная игра , где

конечное множество генов в роли игроков,

— характеристическая функция, присваивающая каждой коалиции среднее значение количества образцов с интересующей нас болезнью

где , а — опора вектора.

Класс микрочиповых игр обозначим символом ℳ.

Простой игрой будем называть игру на , где если , и — в противном случае.

Любая кооперативная игра может быть записана в виде линейной комбинации единогласных игр:

где — коэффициент единогласия, а .

Через коэффициенты единогласия игры могут быть даны модифицированные представления вектора Шепли

и индекса Банзафа

которые обладают свойствами, соответствующими биологическим законам.

Индексом значимости — это решение в классе микрочиповых игр с набором генов в качестве множества игроков. В контексте микрочиповых игр, решение рассматривается как вектор ранжирования силы генов, то есть ген получивший наибольший «выигрыш» является наисильнейшим в данной выборке и так далее.

Результаты. Возьмем посмертные данные микрочипов из тканей лобной и височной коры головного мозга, а также гиппокампа у пациентов с наличием болезни Альцгеймера или другой сосудистой деменции.Эти данные находятся в открытом доступе [3]. За больные образцы взяты образцы тканей с болезнью Альцгеймера, за «здоровые» — образцы с другой деменцией.

Рассмотрим МЭС , где , . Получаем следующие данные. При использовании индекса Банзафа многие гены получили одинаковый индекс значимости (рис. 1), что обусловлено слишком большим значением, стоящим в знаменателе при вычислении индекса Банзафа, а именно , где — мощность коалиции, в то время, как в знаменателе вектора Шепли стоит просто . Первые 10 генов по убыванию индекса значимости, вычисленному с помощью вектора Шепли, представлены в таблице 1.

Таблица 1

Первые 10 генов по индексу значимости, посчитанному спомощью вектора Шепли, умужчин иженщин вместе ипо отдельности

Мужчины иЖенщины

Мужчины

Женщины

Ген

Ген

Ген

RYR1

1,42125

ACAA1

0,87529

ZC3H11A

1,40275

HYDIN2

1,3214

HNRNPA3P1

0,79922

CCDC190

1,39448

FAHD2B

1,31450

MMAB

0,79355

ALDH2

1,19962

GALNT15

1,27645

TDH

0,7922

AF074983

1,10729

ECHDC2

1,17365

NINL

0,78509

RHBDD1

1,08732

PLEC

1,16275

TDRD3

0,78163

ARHGEF10

1,07735

PFDN5

1,14733

WDR49

0,77295

AK023372

1,02686

ZC3H11A

1,13735

ZNF185

0,77011

ZNF761

0,99062

NDUFS6

1,1145

PFDN5

0,76712

ADGRA3

0,98517

WDR49

1,08939

ZNF844

0,76267

RYR1

0,98269

Глобально разница в результатах представлена на левом графике (рис. 1), по вертикали стоит значение индекса значимости, а по горизонтали — ранг гена, вычисленного с помощью вектора Шепли. На правом графике показано, что при уменьшении количества рассматриваемых генов с 4033 до 15 уменьшается и разница в рангах генов, найденных двумя разными способами, что говорит о возможности использования индекса Банзафа для вычисления индекса значимости при небольшом количестве генов.

Рис. 1. Разница в индексах значимости генов, полученных с помощью вектора Шепли и индекса Банзафа для 4033 и 15 генов

Доказано, что у мужчин и женщин болезнь Альцгеймера протекает по-разному. Рассмотрим еще две МЭС для мужчин и для женщин. В таблице 2 так же представлены первые 10 позиций по индексу значимости, посчитанного с помощью вектора Шепли отдельно для мужчин и женщин.

Многие полученные результаты подтверждены современными научными публикациями: например, влияние генов RYR1 и ALDH2 на процесс болезни Альцгеймера описано в [4] и [5], роль шаперонов в патогенезе болезни Альцгеймера, в комплекс которых входит ген PFDN5, описана в [6]. Также выявлены гены, которые могут играть ключевую роль при патогенезе этой болезни, но еще не рассмотренные в научной литературе.

Вывод. Результатом использования рассмотренного подхода является распределение вектора решения, примененного к микрочиповой игре. Данный подход представляет интерес для генетического анализа и предлагает новый математический подход для данной области.

Литература:

  1. Moretti S., Patrone F., Bonassi S. The class of microarray games and the relevance index for genes // TOP. 2007. No 15. P. 256–280.
  2. Lucchetti R., Moretti S., Patrone F., Radrizzani P. The Shapley and Banzhaf value in microarray games. // Computers & Operations Research 37. 2010. P. 1406–1412.
  3. The National Center for Biotechnology Information. https://www.ncbi.nlm.nih.gov/geo/gds/analyze/analyze.cgi?ID=GDS4758.
  4. Chami M., Checler F. Ryanodine receptors: dual contribution to Alzheimer disease? // Channels (Austin). 2014. P. 168–168.
  5. Ma L., Lu Z. N. Role of ADH1B rs1229984 and ALDH2 rs671 gene polymorphisms in the development of Alzheimer’s disease // Genet. Mol. Res. 2016. Vol. 15. No 4. P. 1–8.
  6. Loke S. Y., Wong P. T., Ong W. Y. Global gene expression changes in the prefrontal cortex of rabbits with hypercholesterolemia and/or hypertension // J. Mol. Neurosci. 2007. No 102. P. 33–56.
Основные термины (генерируются автоматически): ген, профиль экспрессии, помощь вектора, индекс значимости, игра, генетическое заболевание, кооперативная игра, NINL, противный случай, MMAB.


Похожие статьи

Изменения в представлении о патогенезе Ph-негативных...

При помощи современных молекулярно-генетических методов (аллель-специфическая полимеразная цепная реакция (ПЦР), пиросеквенирование, количественная ПЦР в

Вероятнее всего существует еще какое-то генетическое нарушение, лежащее в основе этих заболеваний.

Современный взгляд на болезнь Альцгеймера | Статья в журнале...

Вследствие высокой частоты заболевания и особой тяжести болезнь Альцгеймера (БА) становится важной медицинской и социально-экономической проблемой современного цивилизованного мира, и ее значение будет неуклонно возрастать по мере старения населения.

Полиморфизм генов гемостаза у мужчин и женщин с бесплодием

При нарушениях метаболизма гомоцистеина вследствие генетических дефектов ферментов

Гены системы свертываемости крови, влияют на свертываемость крови и склонность к

Так, у мужчин и женщин с нарушением фертильности в 64% случаев полиморфизм генов фолатного...

«Виктория» — метод подбора спутника жизни по группе крови...

Ключевые слова: активный биоритм, пассивный биоритм, группа крови, резус-фактор, мутация генов, спутник жизни. Введение: являясь своеобразным продолжением предыдущей статьи, в которой мы с вами научились определять группу крови и резус-фактор [2]...

Генетические аспекты болезни Паркинсона | Статья в журнале...

Актуальность. Болезнь Паркинсона (БП) — второе по частоте (после болезни Альцгеймера) нейродегенеративное заболевание, встречающееся практически повсеместно. Заболевание развивается чаще всего у лиц страше 60 лет, причем чаще страдают мужчины.

Генетические аспекты рассеянного склероза | Статья в журнале...

Актуальность. Рассеянный склероз является классическим мультифакториальным заболеванием, в этиологии которого важную роль играет взаимодействие внешних факторов и особенностей структуры большого количества генов.

Rh-Hr эритроцитарнные групповые антигены и В и С вирусные...

Частоту генов и гаплотипов системы Rh рассчитывали, используя следующие формулы

Установленная частота антигенов Rh среди инфицированных B и С гепатитамы может быть использована для медико-генетической характеристики групп больных с различными видами...

Современные подходы генетического исследования при...

Актуальной проблемой недоношенных детей, родившихся с низким весом, недостаточности достоверных дородовых прогнозов неблагоприятных первичных результатов, например, развития кровоизлияния в желудочки головного мозга (ВЖК)...

Новое в методике определения генетических корреляций

Генетические корреляции — особый тип корреляций, используемых для выяснения генетических причин связи между количественными признаками потомков и родителей — играют важную роль в оценке генотипа, однако...

Похожие статьи

Изменения в представлении о патогенезе Ph-негативных...

При помощи современных молекулярно-генетических методов (аллель-специфическая полимеразная цепная реакция (ПЦР), пиросеквенирование, количественная ПЦР в

Вероятнее всего существует еще какое-то генетическое нарушение, лежащее в основе этих заболеваний.

Современный взгляд на болезнь Альцгеймера | Статья в журнале...

Вследствие высокой частоты заболевания и особой тяжести болезнь Альцгеймера (БА) становится важной медицинской и социально-экономической проблемой современного цивилизованного мира, и ее значение будет неуклонно возрастать по мере старения населения.

Полиморфизм генов гемостаза у мужчин и женщин с бесплодием

При нарушениях метаболизма гомоцистеина вследствие генетических дефектов ферментов

Гены системы свертываемости крови, влияют на свертываемость крови и склонность к

Так, у мужчин и женщин с нарушением фертильности в 64% случаев полиморфизм генов фолатного...

«Виктория» — метод подбора спутника жизни по группе крови...

Ключевые слова: активный биоритм, пассивный биоритм, группа крови, резус-фактор, мутация генов, спутник жизни. Введение: являясь своеобразным продолжением предыдущей статьи, в которой мы с вами научились определять группу крови и резус-фактор [2]...

Генетические аспекты болезни Паркинсона | Статья в журнале...

Актуальность. Болезнь Паркинсона (БП) — второе по частоте (после болезни Альцгеймера) нейродегенеративное заболевание, встречающееся практически повсеместно. Заболевание развивается чаще всего у лиц страше 60 лет, причем чаще страдают мужчины.

Генетические аспекты рассеянного склероза | Статья в журнале...

Актуальность. Рассеянный склероз является классическим мультифакториальным заболеванием, в этиологии которого важную роль играет взаимодействие внешних факторов и особенностей структуры большого количества генов.

Rh-Hr эритроцитарнные групповые антигены и В и С вирусные...

Частоту генов и гаплотипов системы Rh рассчитывали, используя следующие формулы

Установленная частота антигенов Rh среди инфицированных B и С гепатитамы может быть использована для медико-генетической характеристики групп больных с различными видами...

Современные подходы генетического исследования при...

Актуальной проблемой недоношенных детей, родившихся с низким весом, недостаточности достоверных дородовых прогнозов неблагоприятных первичных результатов, например, развития кровоизлияния в желудочки головного мозга (ВЖК)...

Новое в методике определения генетических корреляций

Генетические корреляции — особый тип корреляций, используемых для выяснения генетических причин связи между количественными признаками потомков и родителей — играют важную роль в оценке генотипа, однако...

Задать вопрос