Выделение доменов в белке

Задание 1 (DOMAK)

В данном задании требуется использовать алгоритм DOMAK для поиска доменов в белке (Colab), в моем случае это антитело — иммуноглобулин класса G и подкласса 1 (PDB ID: 1IGY), точнее, его тяжелая цепь. IgG состоят из двух функционально различных участков: Fc-региона (константный участок антитела) и Fab-региона, участвующего в связывании антитела. Для каждого из них существует внутреннее деление на домены: Vh и Ch1 для Fab Ch2 и Ch3.


sorry :c

Рис.2 Значения SplitValue для 1IGY

sorry :c
Рис.1 Строение IgG и границы доменов из литературы [1]


Наблюдаем четкое разделение на 2 домена с максимумом SplitValue в 242 аминокислоте (Рис.2). Граница доменов находится в линкере и примерно соответствует Fab- и Fc-регионам.

При этом, если посмотреть на график с логарифмами SplitValue, можно обнаружить еще две границы доменов (с соответствующими максимумами в 113 и 358 остатках), которых не видно из-за больших значений основного пика. Они также примерно соответствуют границам между доменами Vh и Ch1, Ch2 и Ch3 из литературы. Структура, разделенная на домены, приведена на Рис.3.


sorry :c

Рис.3 Значения log SplitValue для 1IGY

sorry :c

Рис.4 Границы доменов согласно алгоритму DOMAK

Задание 2 (SCOP, CATH)

В этом задании предложено сравнить результаты, полученные алгоритмом DOMAK, с соответствующими записями в базах данных структурных доменов SCOP и CATH. Соответствующая информация может быть найдена на странице структуры в PDB. Поскольку в разделе SCOP2 в PDB есть записи только для легкой цепи, вместо этого была расммотрена база данных SCOPe. И в ней, и в CATH выделены четыре домена с близкими границами (Таблица 1), ожидаемо соответствующие Vh, Ch1,Ch2 и Ch3 доменам. Наиболее сильно различаются границы между вторым и третьим доменом, соответствующие границам между Fab- и Fc-сегментами, и даже понятно, почему: в этом месте расположен длинный линкер (т.н. "hinge region" [1]).

Задание 3 (InterPro)

В этом задании предложено сравнить результаты, полученные алгоритмом DOMAK, с соответствующими записями в базе данных структурных доменов InterPro с помощью поиска по последовательности. В отличие от трех предыдущих делений на домены, здесь не включаются части линкеров. Все четыре способа разметки собраны в Таблице 1.

Важное уточнение! Нумерация в PDB-файле странная и не совпадает с самой последовательностью в FASTA-файле. Именно она используется при подсчете SplitValue. Поскольку это мешает при сравнении разметок доменов из InterPro и остальных источников, границы доменов в InterPro были перенумерованы.

sorry :c
Рис.5 Границы доменов согласно базе данных InterPro
Таблица 1
Домен 1 (Vh) Домен 2 (Ch1) Домен 3 (Ch2) Домен 4 (Ch3)
DOMAK 2-113 114-242 243-358 359-474
CATH 2-113 114-239 240-360 361-474
SCOP 2-113 114-235 236-361 363-474
InterPro 2-112 118-223 245-357 367-474

Можно сказать, что в целом разметка на домены с помощью алгоритма DOMAK и в базах данных CATH и SCOP похожа, а наибольшие различия находятся между вторым и третьим доменом, а причина, вероятно, в наличии длинного линкера. В базе данных InterPro линкеры не были включены в домены, но несмотря на это, любой из четырех вариантов выглядит разумно, все они соответствуют однозначному разделению на вариабельный домен, участвующий непосредственно в распознавании и связывании эпитопов, и три константных, отвечающих за реализацию функций IgG путем связывания с соответствующими рецепторами [2].

sorry :c
Рис.6 Наименьшие границы доменов, общие между всеми четырьмя источниками. Они соответствуют доменам InterPro. Линкерные участки окрашены в коралловый цвет и, поскольку границы довольно схожие, отдельно для CATH/SCOP/DOMAK они не показаны. PyMOL-сессия
.

Литература (это Википедия, но речь все-таки про антитела ☺)

  1. https://en.wikipedia.org/wiki/Immunoglobulin_G
  2. https://en.wikipedia.org/wiki/Antibody

I don't know how to make footer properly. You may as well pretend you haven't seen this phrase!

↩ К странице семестров