Применение методов теории кооперативных игр в генетике | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 13 марта, печатный экземпляр отправим 17 марта.

Опубликовать статью в журнале

Библиографическое описание:

Василевская, Е. В. Применение методов теории кооперативных игр в генетике / Е. В. Василевская, И. А. Пелешок, А. Р. Сеитова, О. А. Кащеева. — Текст : непосредственный // Молодой ученый. — 2020. — № 18 (308). — С. 1-6. — URL: https://moluch.ru/archive/308/69474/ (дата обращения: 27.02.2021).



Анализ данных генной экспрессии требует подходящих инструментов для хранения и использования, соответствующих объемом данных; одной из последних и полезных технологий является технология микрочипов, которые позволяют хранить данные в единой матрице. В настоящее время данная технология может генерировать огромное количество информации о генной экспрессии. Эта информация должна быть статистически обработана и проанализирована для выявления тех генов, которые полезны для диагностики и прогноза конкретных заболеваний. Мы рассмотрим возможность применения игровых теоретических инструментов для анализа данных экспрессии генов, аксиоматически охарактеризуем эти инструменты, используя свойства с генетической интерпретацией.

Ключевые слова: коалиционная игра, значение Шепли, Индекс Банзафа, MSC-вектор, CGM-вектор, метод равных доходов, экспрессия гена, патогенез.

Как известно, белки являются структурными составляющими клеток и тканей и могут действовать при необходимости как ферменты для реакций в биологических системах. Большинство генов содержат информацию для изготовления конкретного белка. Она кодируется в генах с помощью дезоксирибонуклеиновой кислоты (ДНК). С помощью технологии микрочипов можно выяснить роль отдельных генов или групп генов в появлении болезни. В практическом отношении применение микрочипов уже сегодня позволяет решать следующие задачи:

– точная постановка диагноза и выявление новых подтипов заболевания

– прогнозирование течения болезни и клинического исхода, выявление генов, вовлеченных в патогенез онкогематологических заболеваний

– разработка и создание более простых и дешевых диагностических тестов, в том числе и на основе технологии микрочипов (микрочипы, содержащие пробы на десятки или сотни генов вместо десятков и сотен тысяч).

В статье [3] V. Fragnelli и S. Moretti рассматривают игру с генами для классификации образцов в определенные классы (например, класс образцов из нормальных тканей и из тканей больных раком). В некоторых численных примерах авторы используют вектор Шепли для вычисления генов с высоким влиянием в вычислении образцов.

В статье [4] дана аксиоматическая характеристика значения Шепли с помощью пяти свойств, подходящих для генетической интерпретации этого индекса.

Математическая постановка

Пусть G= {1, 2,..., n} набор из n генов, SR={1, 2,..., r} множество образцов клеток из здоровых тканей, и SD={1, 2,..., d} множество образцов из тканей, представляющих интерес. Цель состоит в том, чтобы сопоставить каждому образцу jSD∪SR профайл экспрессии G. Набор данных представлен в форме двух матриц экспрессии: и (где индекс представляет столбец, являющийся профайлом экспрессии образца j).

Характеристическая функция будет вычисляться по формуле:v (T) = , где |SD|-мощность множества больных образцов, а |Q(T)|- мощность множества:

Вектор , где будем называть анормальным профайлом экспрессии. В виде отображения m выразим дискриминантный метод. Существуют различные дискриминантный методы. Например, наивный метод: где 1- аномально, 0- нормально выраженный ген:

Также можно воспользоваться более консервативным методом. Для каждого

Где и являются 25-ым и 75-ым процентилями распределения экспрессии гена в соответствующей матрице экспрессии

Возможные методы решения

В настоящее время для данной задачи существует несколько возможных методов решения: вектор Шепли, индекс Банзафа, MSC-вектор, CGM-вектор, метод равных доходов. Рассмотрим каждый из них.

Одно из самых популярных решений — вектор Шепли.

Для подсчета вектора необходимо ввести понятие личного вклада каждого гена в образование генотипа, определяемого формулой: m(v, S)= v(S)-v(S\{i}).

Полученные нами данные позволяют ввести вектор Шепли:

Другое решение кооперативной игры — индекс Банзафа:

MSC-вектор[5]принцип оптимальности, определяющий выигрыш игрока по следующей формуле:

и

CGM-вектор[6] — принцип оптимальности, основанный на r- значении игры и вычисленный по формуле:

Метод равных доходов [7]- вектор, который обеспечивает как можно более высокую относительную прибыль среди игроков:

Аксиоматическая характеристика возможных методов решения с помощью свойств, подходящих для генетической интерпретации.

Для того чтобы охарактеризовать решения с помощью свойств с генетической интерпретацией, определение партнерства генов играет основную роль.

Определение 1. Пусть v MN. Коалиция S 2N\ {} такой, что для каждого T⊊S и каждого R ⊆ N \ S: v (R ∪ T) = v (R) — это партнерство генов в игре микроматрицы v.

Значение v(S) партнерства генов S-максимальное среднее количество появлений опухоли. Пусть vM. Максимальное партнерство S ∈ \ {∅} в v является максимальным подмножеством N с возможностью быть партнерством в v. Обозначим через P(v) множество всех максимальных партнерств в v. Отметим, что из определения 1 следует, что все коалиции одного игрока являются партнерствами в v. Набор максимальных партнерств в v образует разделение N. Здесь мы рассмотрим некоторые интересные свойства для решений игр с микрочипами, которые связаны с концепцией партнерства генов. Пусть F: MN→ IRN — решение на классе игр с микрочипами.

Свойство 1. Пусть (N,v) ∈ Решение F имеет Рациональность Партнерства (Partnership Rationality), если для каждого S ∈ \ {∅} такого, что S является партнерством генов в игре (N,v).

Свойство 2. Пусть (N,v) ∈ Решение F обладает свойством вероятности партнерства (Partnership Feasibility), если для каждого такого S ∈ \ {∅}, что S является партнерством генов в игре (N,v).

Свойство 3. Пусть (N,v) ∈ Решение F обладает свойством монотонности партнерства (Partnership Monotonicity), если для каждого i ∈ S и каждого j ∈ T, где S, T ∈ \ {∅}партнерства генов в (N,v), такой, что S ∩ T = ∅, v (S) = v (T), v (S ∪ T) = v (N), |S|≤|T|.

Свойство 4. Пусть . Решение F обладает свойством равного деления (Equal Splitting), если .

Определение 2. Нулевым геном игры (𝑁, 𝑣) будем называть ген 𝑖 ∈ 𝑁 такой что 𝑣(𝑆 ∪ 𝑖) = 𝑣(𝑆) для каждой коалиции 𝑆 ⊆ 𝑁\{𝑖}

Свойство 5. Пусть v, w ∈ . Решение F, удовлетворяет свойству нулевого игрока (Null Player), если для каждого нулевого игрока i ∈ N: Fi(v) = 0.

В статье [8] представлено доказательство утверждения, что значение Шепли удовлетворяет свойствам PM, PR, PF. В этой же статье можно найти доказательство следующей теоремы:

Теорема 1. Пусть дано конечное множество N. Значение Шепли на классе MN игр с микрочипами — это уникальный индекс релевантности, который удовлетворяет PR, PF, PM, ES и NP.

Таким образом, можем сделать вывод, что кооперативная теория игр может применяться для микрочиповых игр, например вектор Шепли и индекс Банзафа.

Далее было проверено, удовлетворяют ли MSC-вектор, CGM-вектор и метод равных доходов свойствам PR,PF,PM,ES и NP.

Рассмотрим MSC-вектор.

А) Для каждого SS- максимальное партнерство по v. Так как v- монотонна и MSC- вектор находится в C- ядре, то справедлива запись:

Так как MSC-вектор является одноточечным, то это решение эффективно. А из этого следует: значит, аксиома PF выполняется.

Б) Исходя из того, что это вектор, можем умножить на скаляр. Из чего следует однородность, а значит, справедлива запись: Для MSC-вектора свойство ES выполняется.

В) Для доказательства удовлетворения MSC- вектора аксиоме PR, вспомним, что v- монотонна и MSC-вектор принадлежит C-ядру, а значит, верна запись: Таким образом, для MSC- вектора выполняется аксиома PR.

Г) Теперь рассмотрим, выполняется ли для MSC-вектора аксиома болвана: пусть вклад i-ого игрока в коалицию: , то есть

По условию индивидуальной рациональности: . О равенстве нулю однозначно сложно сказать. Было проведено исследование свойств одноточечных решений и их применения для исследований. Вектор MSC в общем случае не удовлетворяет аксиоме NP. Записав условия на компоненты вектора X: , можно сделать вывод, что данный вектор будет удовлетворять аксиоме NP, в том случае, если

Рассмотрим метод равных доходов:

А) Пусть вклад i-ого игрока в коалицию: , то есть Это возможно, при Условие коалиционной рациональности: Таким образом, метод равных доходов удовлетворяет условию NP, при

Б) Так как v- монотонна и EPM находится в С-ядре, то верно:

Данное решение является вектором, а значит одноточечно. Из всего перечисленного следует эффективность:

Следовательно, аксиома PF выполняется для метода равных доходов.

В)Для доказательства удовлетворения метода равных доходов аксиоме PR, вспомним, что v- монотонна и данное решение принадлежит C-ядру, а значит, верна запись: Таким образом, для EPM выполняется аксиома PR.

Г) Исходя из того, что это вектор, можем умножить на скаляр. Из чего следует однородность, а значит, справедлива запись: Для EPM свойство ES выполняется.

Рассмотрим CGM- вектор:

А) Так как это вектор, можем умножить на скаляр, следовательно, данное решение удовлетворяет свойству однородности, а значит, справедлива запись: Для CGM свойство ES выполняется.

Б) Рассмотрим CGM-вектор. Для каждого SS- максимальное партнерство по v. Так как v- монотонна и CGM- вектор находится в C- ядре, то справедлива запись: Так как CGM-вектор является одноточечным, то это решение эффективно. А из этого следует значит, аксиома PF выполняется.

В) Для доказательства удовлетворения CGM- вектора аксиоме PR, вспомним, что v- монотонна и CGM-вектор принадлежит C-ядру, а значит, верна запись: Таким образом, для CGM- вектора выполняется аксиома PR.

Г) Теперь рассмотрим, выполняется ли для CGM-вектора аксиома болвана: пусть вклад i-ого игрока в коалицию: , то есть

То есть для того, чтобы CGM- вектор удовлетворял аксиоме болвана должно выполняться: или

Выводы

Проведённые исследования показали, что значение Шепли на классе MN игр с микрочипами — это уникальный индекс релевантности, который удовлетворяет PR, PF, PM, ES и NP. Таким образом, можем сделать вывод, что кооперативная теория игр может применяться для микрочиповых игр, например вектор Шепли и индекс Банзафа. Другие приведенные методы MSC-вектор, CGM-вектор и метод равных доходов в общем случае не удовлетворят свойствам PR,PF,PM,ES и NP. Также в данной работе представлены условия, при выполнении которых вышеупомянутые методы можно реализовывать для задач генетики.

Заключение

В данной работе были рассмотрены различные методы теории игр и аксиоматическая характеристика возможных методов решения с помощью свойств, подходящих для генетической интерпретации. Было проведено исследование свойств одноточечных решений, а именно подробное изучение факта удовлетворения свойствам, обеспечивающим возможность применения в генетике.

Литература:

  1. статья Gupta S., Manubhai K. P., Kulkarni V., Srivastava S. An overview of innovations and industrial solutions in Protein Microarray Technology // Proteomics. 2016. 16:1297–1308.
  2. Moretti, S., Vasilakos, Athanasios V. «An overview of recent applications of Game Theory to bioinformatics».
  3. «A game theoretical approach to the classification problem in gene expression data analysis» V. Fragnelli и S. Moretti.
  4. Stefano Moretti, Fioravante Patrone, Stefano Bonassi. ‘The class of microarray games and the relevance index for genes’.
  5. Jaeger J, Spang R, 2006.
  6. Smyth, G. K., Yang, Y.-H., Speed, T. P. «Statistical issues in cDNA microarray data analysis»
  7. Dhammika Amaratunga & Javier Cabrera “Exploration and Analysis of DNA Microarray and Protein Array Data”.
  8. «A game theoretical approach to the classification problem in gene expression data analysis» V. Fragnelli и S. Moretti.
Основные термины (генерируются автоматически): CGM, MSC, вектор, EPM, партнерство генов, свойство, генетическая интерпретация, решение, аксиома, возможный метод решения.


Ключевые слова

патогенез, коалиционная игра, значение Шепли, Индекс Банзафа, MSC-вектор, CGM-вектор, метод равных доходов, экспрессия гена

Похожие статьи

Генетическая характеристика фитопатогенных микроорганизмов...

На основании данных анализа нуклеотидной последовательности гена 16SрРНК определена таксономическая принадлежность 19 культур фитопатогенных бактерий, изолированных из клубней топинамбура с признаками бактериозов.

Применение вектора Шепли и индекса Банзафа для определения...

Целью данной работы является решение проблемы определения относительной значимости генов при патогенезе болезни Альцгеймера, используя данные, полученные с помощью технологии микрочипов, с учетом уровня взаимодействия между генами. Обзор литературы.

Обзор метода CRISPR/Cas 9 для редактирования генома

В статье авторы рассказывают о современном методе редактирования генов CRISPR/Cas9.

Благодаря HDR в целевой локус возможно помещение сайта рестрикции, маркерной метки

В контексте функциональной коррекции генетических аномалий, обусловленных делецией генов...

Роль графического метода в принятии управленческих решений.

Рассмотрим данный метод решения подробнее.

Возможный вид области допустимых решений представлен на рисунке 1 (область выделена штриховкой).

Как видно, решение такой задачи, показавшейся первоначально довольно сложной, потребовало совсем немного...

Полиморфизм генов гемостаза у мужчин и женщин с бесплодием

Библиографическое описание: Онуфриенко, Е. А. Полиморфизм генов гемостаза у мужчин и женщин с

При нарушениях метаболизма гомоцистеина вследствие генетических дефектов

Гены системы свертываемости крови, влияют на свертываемость крови и склонность к...

Моделирование супервизорного управления ПИД-регулятором на...

Для решения данной проблемы необходима адаптация регуляторов на основе искусственных нейронных сетей.

Хромосома представляет собой альтернативное решение задачи.

Похожие статьи. Метод структурного и параметрического синтеза и анализа...

Метод структурного и параметрического синтеза и анализа...

Особенности параметров установок требуют решения вопроса их структурного отображения.

Для решения подобных задач в комбинаторике существуют соответствующие методы, например, метод ветвей и границ, хотя их применение на практике и встречается с...

С++ библиотека компонентов генетических алгоритмов

В статье дается начальное представление о библиотеке GAlib, которая позволяет решать задачи с помощью генетических алгоритмов. Рассматриваются основные возможности и классы библиотеки, также рассматриваются особенности установки и настройки библиотеки.

Обзор методов решения задачи удовлетворения ограничений

Ключевые слова: искусственный интеллект, задача удовлетворения ограничений, поиск с возвратом, генетический алгоритм, распространение ограничений, алгоритм Вальца, разметка изображений.

Похожие статьи

Генетическая характеристика фитопатогенных микроорганизмов...

На основании данных анализа нуклеотидной последовательности гена 16SрРНК определена таксономическая принадлежность 19 культур фитопатогенных бактерий, изолированных из клубней топинамбура с признаками бактериозов.

Применение вектора Шепли и индекса Банзафа для определения...

Целью данной работы является решение проблемы определения относительной значимости генов при патогенезе болезни Альцгеймера, используя данные, полученные с помощью технологии микрочипов, с учетом уровня взаимодействия между генами. Обзор литературы.

Обзор метода CRISPR/Cas 9 для редактирования генома

В статье авторы рассказывают о современном методе редактирования генов CRISPR/Cas9.

Благодаря HDR в целевой локус возможно помещение сайта рестрикции, маркерной метки

В контексте функциональной коррекции генетических аномалий, обусловленных делецией генов...

Роль графического метода в принятии управленческих решений.

Рассмотрим данный метод решения подробнее.

Возможный вид области допустимых решений представлен на рисунке 1 (область выделена штриховкой).

Как видно, решение такой задачи, показавшейся первоначально довольно сложной, потребовало совсем немного...

Полиморфизм генов гемостаза у мужчин и женщин с бесплодием

Библиографическое описание: Онуфриенко, Е. А. Полиморфизм генов гемостаза у мужчин и женщин с

При нарушениях метаболизма гомоцистеина вследствие генетических дефектов

Гены системы свертываемости крови, влияют на свертываемость крови и склонность к...

Моделирование супервизорного управления ПИД-регулятором на...

Для решения данной проблемы необходима адаптация регуляторов на основе искусственных нейронных сетей.

Хромосома представляет собой альтернативное решение задачи.

Похожие статьи. Метод структурного и параметрического синтеза и анализа...

Метод структурного и параметрического синтеза и анализа...

Особенности параметров установок требуют решения вопроса их структурного отображения.

Для решения подобных задач в комбинаторике существуют соответствующие методы, например, метод ветвей и границ, хотя их применение на практике и встречается с...

С++ библиотека компонентов генетических алгоритмов

В статье дается начальное представление о библиотеке GAlib, которая позволяет решать задачи с помощью генетических алгоритмов. Рассматриваются основные возможности и классы библиотеки, также рассматриваются особенности установки и настройки библиотеки.

Обзор методов решения задачи удовлетворения ограничений

Ключевые слова: искусственный интеллект, задача удовлетворения ограничений, поиск с возвратом, генетический алгоритм, распространение ограничений, алгоритм Вальца, разметка изображений.

Задать вопрос