Настоящая работа представляет собой квинтэссенцию актуальных биоинформатических методов, позволяющих проводить трехмерное моделирование, а также верификацию третичных структур белковых молекул. Приведено описание и основные характеристики таких сервисов, как SWISS-MODEL, Robetta, Phyre2, MODELLER, SAVES v6.0 и Structure Assessment.
Ключевые слова : трехмерная структура белков, SWISS-MODEL, Robetta, Phyre2, MODELLER, SAVES v6.0, Structure Assessment.
Сегодня вычислительная и компьютерная техника достигла значительного развития, и проведение любого качественного научного исследования без нее уже не представляется возможным. Важное место в биомедицинских исследованиях занимают структуры белковых молекул. Установление трехмерных структур белков крайне важно в понимании патогенеза ряда заболеваний, разработке высокоаффинных лекарственных препаратов и делает возможным проведение таргетной терапии, в том числе в контексте терапии онкологических заболеваний.
Однако традиционных методов установления структур, к примеру, рентгеноструктурного анализа и электронной микроскопии, очевидно, недостаточно для удовлетворения предъявляемого запроса на данного рода структуры. Снабдить исследователей более полной информацией о структурах белков позволяют развивающиеся in silico методы.
Целью данной работы является информирование исследователей об имеющихся онлайн-сервисах и программах, позволяющих проводить молекулярное моделирование и верификацию полученных структур.
Построение белковых 3D-структур может осуществляться при помощи следующих сервисов: SWISS-MODEL, Robetta, Phyre2 и MODELLER.
SWISS-MODEL [1] представляет собой онлайн-сервис, предназначенный для гомологичного моделирования белковых молекул, где за основу берется наиболее близкая по аминокислотной последовательности ранее установленная 3D-структура. Установление моделей происходит в несколько этапов: определение структурных референсов, выравнивание интересующей и референсных последовательностей, построение модели и оценка ее качества. Сервис обеспечивает интегрированную работу программного обеспечения и актуальных баз данных, содержащих последовательности и структуры белков, что необходимо для корректной работы сервиса.
Robetta [2] — это сервер прогнозирования конфигураций белковых структур, в основе которого лежит программный пакет Rosetta для моделирования на макромолекулярном уровне. Основной функционал Robetta сводится к предсказанию трехмерной структуры белка на основе его аминокислотной последовательности. Предсказание структуры осуществляется методом гомологического моделирования либо моделирования ab initio (сервис самостоятельно проводит фолдинг белка, выбирая наиболее выгодную с энергетической точки зрения модель) в зависимости от выбранных опций. Построение образцов может осуществляться с использованием протокола RoseTTAFold, представляющего собой нейронную сеть, которая одновременно оценивает паттерны белковых последовательностей, взаимодействие между аминокислотами и оценивает потенциальную 3D-структуру белка.
Phyre2 [3] представляет собой комбинацию большого количества нескольких программных компонентов, которые обеспечивают гомологичное моделирование на основе одной или нескольких референсных последовательностей и моделирование ab initio. Сервис автоматически подбирает референсные структуры, обеспечивая максимальную достоверность, идентичность (в %) и охват интересующей последовательности, и создает только одну модель.
MODELLER [4] — программа для гомологичного и сравнительного моделирования трехмерной структуры белка с учетом пространственных ограничений. Метод основан на выравнивании входной последовательности, подлежащей моделированию, и референсной аминокислотной последовательности («шаблонным белком», структура которого ранее была установлена). С целью повышения точности моделирования был задействован алгоритм, использующий несколько последовательностей в качестве референсных (multi-template homology modelling).
Для оценки качества трехмерных моделей, предлагаемых программами, могут использоваться следующие сервисы:
Structure Assessment (онлайн-сервис SWISS-MODEL) . Рассчитывает показатель QMEANDisCo, который позволяет дать абсолютную оценку качества модели. Этот параметр определяет локальное качество для каждого остатка путем оценки соответствия попарных расстояний остаток-остаток с учетом пространственных ограничений. Программа определяет значения Cβ и All Atom (потенциалы взаимодействия, зависящие от расстояния, на основе атомов Cβ и всех атомов, соответственно), Solvation (эффект сольватации), Torsion (угол торсии для трех последовательных аминокислот, оценивается локальная геометрия), QMEAN (описывает основные геометрические аспекты белковых структур, используя вышеперечисленные параметры). Перечисленные показатели формируются на основании сравнения анализируемой модели и экспериментально определенных структур аналогичного размера; структуры получившие значения близкие к нулю считаются нативными; неудачными обычно считаются значения меньше «-4». Сервис также позволяет построить карту Рамачандрана с разрешением 2,5 Å.
SAVES v6.0 (UCLA-DOE LAB). Программа предоставляет следующие инструменты: ERRAT — анализирует белковые структуры на предмет наличия несвязанных остатков в пределах 3,5 Å между различными атомами, рассчитывая общий коэффициент качества. Для высококачественной модели значение должно превышать 50; VERIFY3D — задействует структурную базу данных и сопоставляет трехмерную структуру с аминокислотной последовательностью, проводя сравнение качества предоставленной структуры с белковыми структурами с высоким разрешением из базы данных; PROCHECK — анализирует общую геометрию и оценивает стереохимическое качество прогнозируемой модели, строит карту Рамачандрана с разрешением 2,0 Å.
Таким образом, в работе показан ряд наиболее часто используемых программ, использующих разные принципы предсказания трехмерных структур белков на основании первичной аминокислотной последовательности.
Литература:
1. Andrew Waterhouse and others, SWISS-MODEL: homology modelling of protein structures and complexes, Nucleic Acids Research, Volume 46, Issue W1, 2 July 2018, Pages W296–W303, DOI: 10.1093/nar/gky427.
2. Minkyung Baek, et al., Accurate prediction of protein structures and interactions using a three-track neural network. Science373, 871–876 (2021). DOI: 10.1126/science.abj8754.
3. Kelley LA, Mezulis S, Yates CM, Wass MN, Sternberg MJ. The Phyre2 web portal for protein modeling, prediction and analysis. Nat Protoc. 2015 Jun;10(6):845–58. DOI: 10.1038/nprot.2015.053.
4. Webb B, Sali A. Protein Structure Modeling with MODELLER. Methods Mol Biol. 2021;2199:239–255. DOI: 10.1007/978–1–0716–0892–0_14.