Семейства белковых доменов. PFAM

Таблица 1 Информация Комментарии
AC pfam PF02486
ID pfam Rep_trans
Name Replication initiation factor
#SEED 25 (full=638) Число последовательностей в выравнивании SEED. Мы работали с ними в прошлом практикуме.
#All 4000 Число всех белков с доменом семейства.
#SW 7 Число белков с доменом Swissprot.
#architectures 14 Число разных доменных архитектур. Самая распространённая состоит из одного домена PF02486. Примечательно, что все остальные тоже включают его в свой состав, но другой длины. Т.е. какие-то участки вырезаются или же просто это результат мутаций.
#3D 3 Число доменов с известной 3D структурой.
Taxonomy Число всех белков с доменом семейства по супер-царствам.
#eukaryota 9
#archaea 0
#bacteria 4259

Это семейство белков представленно предполагаемыми топоизомеразами, которые делают одноцепочечный разрез в плазмидной ДНК. Это объясняет, почему белок так распространён среди бактерий, а среди эукариот нет.

Построение карты локального сходства

Нам надо выбрать белки одного домена, но с разной доменной архетиктурой:

Таблица 2 Информация Комментарии
Доменная архитектура 1 PF18106 - PF02486 Всего 1114 белков с данной архитектурой
Белок с архитектурой 1 A0A074ITF3_STRSL Replication initiation factor domain-containing protein
Streptococcus salivarius
Доменная архитектура 2 PF22477 - PF02486 Всего 158 белков с данной архитектурой
Белок с архитектурой 2 A0A0U2JD55_STAAU Replication initiation protein
Staphylococcus aureus

Построили карту локального сходства (по горизонтали белок 1, по вертикали белок 2)

В обоих доменных структурах есть общая часть PF02486. В первом случае она более длинная. По карте можно увидеть, что это результат делеции во второй последовательности или же вставки в первой. Первые части обоих белков не выровнялись друг на друга. Они имеют разные последовательности.