Описание семейства

Я остановила свой выбор на домене ABC_toxin_N (PF20220). Запись на Pfam - область, обнаруженная на N-конце домена нейраминидазы в порах, образующих токсины ABC. ABC-токсины – "самособирающиеся наномашины для адресной клеточной доставки биоактивных белков". Такие комплексы представляют интерес в связи с их мощной инсектицидной активностью и потенциальной ролью в развитии заболеваний человека. Они состоят как минимум из 3 белков (A, B и C), и именно их одновременное функционирование обеспечивает необходимый эффект.

AC: PF20220
ID: ABC_toxin_N
Name: ABC toxin N-terminal region
Seed: 31
Full: 396
Architectures: 51

Две самые крупные архитектуры: [ABC_toxin_N, Neuraminidase, TcA_TcB_BD] и [VRP1, ABC_toxin_N, Neuraminidase, TcA_TcB_BD]. К первой относится 125 последовательностей из 396 (31,6%), ко второй - 71 последовательность из тех же 396 (17,9%).
Домен распространён (преимущественно) среди бактерий (Актиномицеты, Протеобактерии, Bacteroisetes, др. более мелкие таксоны), грибов (исключительно Аскомицеты) и в меньшей степени среди эукариот (таксономические категории не указаны). Такое распространение не кажется мне удивительным с учётом функции белков в рассматриваемом семействе.

Множественное выравнивание

Первичное выравнивание с Clustal тут.
При окрашивании Above identity threshold с порогом в 100% (можно найти тут) было обнаружено 2 консервативных для всех последовательностей остатка (позиции 48, 68).
Далее был выставлен порог в 90% (выравнивание с окрашиванием тут). Окрасилось 18 позиций: 8, 41, 46, 48, 58, 63, 68, 73, 79, 120, 132, 142, 143, 150, 151, 154, 158, 162.
При пороге, составляющем 50% (выравнивание тут), окрасилось большое количество позиций (столбцов).

Максимально достоверный блок, включающий не все последовательности, находится на позициях 129-137 (файл здесь). В него входят 23 последовательности из 31. 129 (начальная), 132, 133, 137 (концевая) позиции полностью консервативны, в других случаях присутствуют несовпадения. Видимое сходство последовательностей обнаруживается в начале (позиции 1-16), в середине (38-79) и в конце (120-162 прзиции) выравнивания. Так, белки действительно гомологичны.
Также я нашла несколько участков, не содержащих достоверных подблоков: 1-7, 49-56. Маловероятно, что выравнивание на данном участке отражает ход эволюции.