Я остановила свой выбор на домене ABC_toxin_N (PF20220). Запись на Pfam - область, обнаруженная на N-конце
домена нейраминидазы в порах, образующих токсины ABC. ABC-токсины – "самособирающиеся наномашины для адресной клеточной
доставки биоактивных белков". Такие комплексы представляют интерес в связи с их мощной инсектицидной активностью и потенциальной
ролью в развитии заболеваний человека. Они состоят как минимум из 3 белков (A, B и C), и именно их одновременное
функционирование обеспечивает необходимый эффект.
AC: PF20220
ID: ABC_toxin_N
Name: ABC toxin N-terminal region
Seed: 31
Full: 396
Architectures: 51
Две самые крупные архитектуры: [ABC_toxin_N, Neuraminidase, TcA_TcB_BD] и [VRP1, ABC_toxin_N, Neuraminidase, TcA_TcB_BD].
К первой относится 125 последовательностей из 396 (31,6%), ко второй - 71 последовательность из тех же 396 (17,9%).
Домен распространён (преимущественно)
среди бактерий (Актиномицеты, Протеобактерии, Bacteroisetes, др. более мелкие таксоны), грибов (исключительно
Аскомицеты) и в меньшей степени среди эукариот (таксономические категории не указаны). Такое распространение
не кажется мне удивительным с учётом функции белков в рассматриваемом семействе.
Первичное выравнивание с Clustal тут.
При окрашивании Above identity threshold с порогом в 100% (можно найти
тут) было обнаружено 2 консервативных для всех последовательностей
остатка (позиции 48, 68).
Далее был выставлен порог в 90% (выравнивание с окрашиванием тут).
Окрасилось 18 позиций: 8, 41, 46, 48, 58, 63, 68, 73, 79, 120, 132, 142, 143, 150, 151, 154, 158, 162.
При пороге, составляющем 50% (выравнивание тут), окрасилось
большое количество позиций (столбцов).
Максимально достоверный блок, включающий не все последовательности, находится на позициях 129-137 (файл
здесь). В него входят 23 последовательности из 31. 129 (начальная),
132, 133, 137 (концевая) позиции полностью консервативны, в других случаях присутствуют несовпадения. Видимое сходство
последовательностей обнаруживается в начале (позиции 1-16), в середине (38-79) и в конце (120-162 прзиции)
выравнивания. Так, белки действительно гомологичны.
Также я нашла несколько участков, не содержащих достоверных подблоков: 1-7, 49-56. Маловероятно, что выравнивание на
данном участке отражает ход эволюции.