Выбрал семейство доменов ABC_ATPase (код доступа PF09818), 1006 последовательностей, 30 — в выравнивании seed, 8 доменных архитектур с этим доменом. ABC транспортеры относятся к ATP-Binding Cassette (ABC) superfamily, это одно из самых больших среди всех белковых семейств с различными физиологическими функциями. ABC транспортеры участвуют в экспорте или импорте широкого спектра субстратов, начиная от небольших ионов и заканчивая макромолекулами. Используют АТФ чтобы заряжать энергией различные биологические системы. ABC superfamily
Выбрал две достаточно представленные доменные архитектуры: ABC_N, ABC_ATPase (876 белков) и ABC_ATPase (80 белков). Есть два белка с доменом семейства, для которых известна 3D структура. По крупным таксонам следующее распределение: 730 белков бактерий, 221 - эукариот и 34 — архей.
HMM профиль был создан в 2004, в нем 283 позиции.
Для построения карты взял белки W9ABE2_9BACI АТФаза ABC класса из Oceanobacillus picturae и A0A090SH86_9VIBR изопентинил-дифосфат дельта-изомераза из Vibrio variabilis
Карту строил для участков 199-299 для АТФазы и 460-560 для изопентинил-дифосфат дельта-изомеразы
Рис.1 Карта локального сходства (Dot Plot) белков W9ABE2_9BACI (горизонтальная ось) и X6P668_RETFI (вертикальная ось)
Видим двe инсерции на участках 524-525 и 535-542 в белке W9ABE2_9BACI, или две делеция на 265 и 274 позициях в A0A090SH86_9VIBR, смотря как интерпретировать.
Скачал выравнивание seed (30 последовательностей), загрузил в Jalview, построил дерево и по нему выделил две подгруппы доменов, одна оказалась сильно меньше другой
Посмотреть проект можно здесь
Отличие подгрупп: в меньшей подгруппе наблюдается инсерция (47-52), делеция (219-224), которых не наблюдается ни в одном из белков большей подгруппы
Запрос database:(type:pfam pf...) не работал, вероятно, из-за обновления сайта. Искал по запросу (xref:pfam-PF09818)
Таблица здесь