При выборе белкового семейства я прежде всего опирался на рекомендованные параметры поиска. После применения нужных фильтров в таблице всех семейств из Pfam я просто нашёл то из них, которое показалось мне интересным. Ниже приведено его описание.
Pf-номер: PF10659
ID: Trypan_glycop_C
Название: Trypanosome variant surface glycoprotein C-terminal domain
Число объектов seed: 44
Число объектов full: 75
Число доменных архитектур: 9
Из них 5 принадлежит белкам Trypanosoma brucei brucei. У этого паразитического организма поверхностные гликопротеины играют важную роль в химическом взаимодействии с клеткой организма-хозяина и избегании иммунного ответа на вторжение (Donelson et al., 1998). Остальные архитектуры принадлежат: водорослям Raphidocelis subcapitata (Chlorophyceae: Sphaeropleales), Thalassiosira oceanica (Ochrophyta: Diatomea), Aureococcus anophagefferens (Ochrophyta: Pelagophycidae) и моллюску Mytilus coruscus.
Из базы данных Pfam скачано выравнивание всех последовательностей из блока seed.
Скачать Jalview-проект выравнивания
В выравнивании нет ни одного достоверного блока, включающего все последовательности. Но присутствуют иные, поменьше. Например, есть максимальный достоверный блок, включающий последовательности с 1 по 11, позиции 118-138. В этом выравнивании он наибольший. В то же время присутствуют участки безо всякого сходства между сиквенсами, например: последовательнсти 17-30, позиции 36-51. Маловероятно, но возможно, что выравнивание на этом участке отражает ход эволюции.
В рассматриваемом выравнивании видимое сходство и, вероятно, гомология последовательностей обнаруживаются только в самом конце, в районе упомянутого максимального достоверного блока. Остальные позиции, за исключением некоторых (например, позиций 69, 79, 94, 96), характеризуются низким процентом сходства.
Donelson, J. Multiple mechanisms of immune evasion by African trypanosomes. Molecular and Biochemical Parasitology 91, 51–66 (1998).