В данном задании требуется использовать алгоритм DOMAK для поиска доменов в белке (Colab), в моем случае это антитело — иммуноглобулин класса G и подкласса 1 (PDB ID: 1IGY), точнее, его тяжелая цепь. IgG состоят из двух функционально различных участков: Fc-региона (константный участок антитела) и Fab-региона, участвующего в связывании антитела. Для каждого из них существует внутреннее деление на домены: Vh и Ch1 для Fab Ch2 и Ch3.
Наблюдаем четкое разделение на 2 домена с максимумом SplitValue в 242 аминокислоте (Рис.2). Граница доменов находится в линкере и примерно
соответствует Fab- и Fc-регионам.
При этом, если посмотреть на график с логарифмами SplitValue, можно обнаружить еще две границы доменов
(с соответствующими максимумами в 113 и 358 остатках), которых не видно из-за больших значений основного пика. Они также примерно соответствуют
границам между доменами Vh и Ch1, Ch2 и Ch3 из литературы. Структура, разделенная на домены,
приведена на Рис.3.
В этом задании предложено сравнить результаты, полученные алгоритмом DOMAK, с соответствующими записями в базах данных структурных доменов SCOP и CATH. Соответствующая информация может быть найдена на странице структуры в PDB. Поскольку в разделе SCOP2 в PDB есть записи только для легкой цепи, вместо этого была расммотрена база данных SCOPe. И в ней, и в CATH выделены четыре домена с близкими границами (Таблица 1), ожидаемо соответствующие Vh, Ch1,Ch2 и Ch3 доменам. Наиболее сильно различаются границы между вторым и третьим доменом, соответствующие границам между Fab- и Fc-сегментами, и даже понятно, почему: в этом месте расположен длинный линкер (т.н. "hinge region" [1]).
В этом задании предложено сравнить результаты, полученные алгоритмом DOMAK, с соответствующими записями в базе данных структурных доменов InterPro с помощью поиска по последовательности. В отличие от трех предыдущих делений на домены, здесь не включаются части линкеров. Все четыре способа разметки собраны в Таблице 1.
Важное уточнение! Нумерация в PDB-файле странная и не совпадает с самой последовательностью в FASTA-файле. Именно она используется при подсчете SplitValue. Поскольку это мешает при сравнении разметок доменов из InterPro и остальных источников, границы доменов в InterPro были перенумерованы.
Домен 1 (Vh) | Домен 2 (Ch1) | Домен 3 (Ch2) | Домен 4 (Ch3) | |
DOMAK | 2-113 | 114-242 | 243-358 | 359-474 |
CATH | 2-113 | 114-239 | 240-360 | 361-474 |
SCOP | 2-113 | 114-235 | 236-361 | 363-474 |
InterPro | 2-112 | 118-223 | 245-357 | 367-474 |
Можно сказать, что в целом разметка на домены с помощью алгоритма DOMAK и в базах данных CATH и SCOP похожа, а наибольшие различия находятся между вторым и третьим доменом, а причина, вероятно, в наличии длинного линкера. В базе данных InterPro линкеры не были включены в домены, но несмотря на это, любой из четырех вариантов выглядит разумно, все они соответствуют однозначному разделению на вариабельный домен, участвующий непосредственно в распознавании и связывании эпитопов, и три константных, отвечающих за реализацию функций IgG путем связывания с соответствующими рецепторами [2].
I don't know how to make footer properly. You may as well pretend you haven't seen this phrase!