Семейства белковых доменов. База данных белковых доменов Pfam.

В предыдущем практикуме, посвященном множественному эволюционному выравниванию, для выполнения задания было выбрано семейство белковых доменов под названием tRNA synthetases class II (D, K and N) с AC PF00152. Аминоацил-тРНК синтетазы (они же АРСазы) катализируют реакции присоединения остатка протеиногенной аминокислоты к молекуле тРНК в процессе трансляции. Эти ферменты делятся на два класса (I и II), принципиально различающиеся по некоторым физико-химическим характеристикам, таким как, например, более предпочтительный сайт для присоединения аминоацильного остатка к сахару (для ферментов, относящихся к первому классу, более предпочтительно присоединение по 2'-гидрокисилу сахара, для ферментов второго класса — по 3'-гидроксильной группе).
Среди особенностей доменных архитектур, в которых представлен рассматриваемый домен, можно выделить присутствие в подавляющем большинстве наиболее широко представленных архитектур тРНК-антикодонового домена (OB-fold nucleic acid binding domain), который, очевидно, будет присутствовать на пару с тРНК-синтетазным доменом в ферментах, осуществляющих присоединение аминокислоты к тРНК.
Касательно 3D-структуры, можно подчеркнуть, что для белков, содержащих данный домен, характерен α/β-тип третичной укладки (центральные бета-листы окружены альфа-спиралями).
Таксономическая представленность белков, содержащих описываемый домен, в значительной степени преобладает в супергруппе Бактерий и составляет более 75% от всех последовательностей. Представленность среди Эукариот и Архей составляет примерно 20% и 4%, соответственно. Краткие характеристики с пояснениями к ним приведены в Таблице 1.

Таблица 1. Описание выбранного семейства эволюционных доменов по основным параметрам, полученным из базы данных семейств белковых доменов Pfam.
Характеристика Информация Комментарии
AC PFAM PF00152 Код доступа (Accession code) выбранного семейства белковых доменов
ID PFAM tRNA synthetases class II (D, K and N) Полное имя (=ID, Name) выбранного семейства белковых доменов
#SEED 83 Число последовательностей в множественном выравнивании seed
#All 159k Общее число белковых, содержащих домен выбранного семейства
#SW 2k Число белков, содержащих домен выбранного семейства, и содержащийся в базе данных Swiss-Prot
#architectures 746 Количество разных доменных архитектур, содержащих домен из рассматриваемого семейства
#3D 126 Количество известных пространственных структур домена из рассматриваемого семейства
Taxonomy 158182 Суммарная таксономическая представленность домена в различных супергруппах организмов (указано число последовательностей)
#eukaryota 30909 Таксономическая представленность домена в супергруппе Эукариот
#archaea 6594 Таксономическая представленность домена в супергруппе Архей
#bacteria 118680 Таксономическая представленность домена в супергруппе Бактерий

Далее, с помощью программы BLASTp была построена карта локального сходства (DotPlot) последовательностаей двух репрезентативных белков их разных доменных архитектур. Для построения карты целеноправленно была выбрана архитектура, представленная в подавляющем большинстве белков (AC репрезентативного белка P15178, количество белков 78142), и архитектура, представленная в очень небольшом числе белков (AC репрезентативного белка Q4TEL0, количество белков 64) для проверки наличия корреляции между представленностью доменной архитектуры и числом и типом мутаций, отображаемых на карте локального сходства. Ниже приведены Таблица 2, в которой описаны основные характеристики доменных архитектур и сама карта локального сходства последовательностей репрезентативных белков (см. рис. 2).

Таблица 2.Описание доменных архитектур, выбранных для построения карты локального сходства (DotPlot).
Название Информация Комментарии
Доменная архитектура 1 PF01336 - PF00152 (tRNA_anti-codon - tRNA-synt_2) Последовательность AC доменов, входящих в состав доменной архитектуры. В скобках — названия соответствующих доменов
Белок с архитектурой 1 P15178 (Aspartate-tRNA ligase) AC и название репрезентативного белка для данной доменной архитектуры
Доменная архитектура 2 PF20917 - PF01336 - PF00152 - PF00152 (AsnRS_N - tRNA_anti-codon - tRNA-synt_2 - tRNA-synt_2) Аналогично комментарию к доменной архитектуре 1
Белок с архитектурой 2 Q4TEL0 (Asparagine-tRNA ligase) Аналогично комментарию к белку с архитектурой 1
Рис.1. Карта локального сходства двух последовательностей репрезентативных белков из соответствующих доменных архитектур.
На карте локального сходства хорошо детектируемы многочисленные делеции (или инсерции), дупликация (примерно с 220 по 280 а.к.о. первой последовательности) и транслокации (примерно с 280 по 300 и с 430 по 460 а.к.о. первой последовательности). Такое количество локальных и более крупных мутаций даёт основания полагать, что белки, содержащие данные архитектуры, довольно сильно разошлись в ходе эволюции и могут выполнять в какой-то степени разные функции.
Для проверки достоверного различия доменов, входящих в состав разных доменных архитектур, были выбраны две доменные архитектуры с AC репрезентативного белка A0A0B3ARG6 и A0A814DDK0, представленные 15 и 24 белками, соответственно.
Координаты достоверных блоков одной архитектуры, не расширающиеся на вторую, в множественном выравнивании двух доменных архитектур блоков следующие: 1-74, 76-114, 116-195, 209-234, 240-243, 267-274, 339-344, 364-373, 378-455, 459-471 колонки.
Исходя из полученных в ходе множественного выравнивания двух доменных архитектур данных, а именно из-за присутствия в выравнивании доменной архитектуры с репрезентативным белком лизил-тРНК-лигаза (AC A0A814DDK0) большого количества достоверных блоков выравнивания, можно предположить, что домены, входящие в состав двух данных доменных архитектур, достоверно различаются, следовательно, эти доменные архитектуры образовались из уже разошедшихся в эволюции доменов. Ссылка на проект в Jalview.