В данном практикуме предлагалось выбрать белок и найти гидрофобные кластеры в его структуре.
Выбранный белок LGP2 с PDB ID: 5JAJ был найден у Gallus gallus (петух) и является РНК-зависимой АТФ-азой, играющей ключевую роль в
индукции иммунного ответа против РНК вирусов, таких как Influenza A virus,
Flavivirus, Sendai virus [1].
Было найдено, что белок имеет четыре домена Pfam. Основные - АТФ-связывающий и
С-терминальный репрессорный домен, посредством которого происходит взаимодействие с RIG-I хеликазой.
Для поиска гидрофобных кластеров был осуществлен запуск сервиса CluD со стандартными параметрами.
В белке нашлось 27 ядер, но только 3 из них оказались достаточно велики
(остальные 24 не больше 31 атома). В первое ядро попало 964 атома,
во второе 167 и в третье - 154. Это составило 14,5%, 2,5% и 2,3% от всех атомов структуры (6638)
соответсвенно.
В состав 1 и 3 гидрофобных ядер были включены только аминокислотные
остатки, а во 2 ядро попали как аминокислоты, так и азотистые основания РНК. Видимо, порог на расстояние между включаемыми в один кластер
атомами оказался большим.
При втором поиске я ограничил порог на расстояние значением в 4.5 ангстрема. Были найдены более осмысленные кластеры, соответствующие особенностям вторичной структуры.
Было решено взять порог чуть больше, так как геликазный домен, показанный розовым на первом рисунке, развалился на два гидрофобных кластера по укладке бета-листа, а АТФ-связывающий домен вообще не был найден. Была выбрана новая граница в 4.7 ангстрема. При данном значении параметра хорошо виден АТФ-связывающий домен, геликазный домен представлен одним кластером, а РНК и белок не объединяются в один кластер.
Для визуализайии гиброфобных кластеров комплекса белка с ДНК была выбрана структура комплекса ДНК-полимеразы гамма с PDB ID: 5C51. Поиск производился со следующими параметрами: Distance threshold 4.7 Angstrom, Show clusters not smaller 50. Всего было найдено 8 крупных кластеров. На рисунке показаны 5 из 8. Видно, что кластеры, в целом, занимают ядра белковых субъединиц. Коричневое и оранжевые ядра плотно прилегают к цепи ДНК.
По результатам работы можно сделать вывод о том, что необходимо тщательно подбирать параметры для разрезания графа. Алгоритм порой оказывался очень чувствителен при изменении порога на расстояние на одну сотую. Думаю, что обязательно нужно комбинировать рассмотренный метод исследования белков с другими, как то: анализ доменов, окружения, сворачивания. Очень часто можно с легкостью, и, возможно, ошибочно, найти объяснение наблюдаемому расположению кластера. Хотелось бы иметь дополниельные критерии оценки и ранжирования качества определяемых кластеров. Наиболее оптимальными праметрами поиска оказались: ограниченние на расстояние - 3.7 ангстрема и ограничение на размер атомов, входящих в кластер - 5.