Пракикум 11: Множественное выравнивание как отражение эволюции белков
Семейство доменов из Pfam для анализа: PF00034
Цитохромы c — это белки, содержащие гем, который ковалентно присоединён к пептиду через одну или две тиоэфирные связи. Эти связи обычно формируются в мотиве Cys-X-X-Cys-His (CXXCH), где X — любая аминокислота. Цистеин связывается с виниловыми боковыми цепями гема, а гистидин координирует одно из аксиальных мест железа гема. Могут встречаться и другие мотивы связывания. Цитохромы c функционируют как переносчики электронов или катализаторы окислительно-восстановительных реакций. Известный представитель этой группы — митохондриальный цитохром c.
AC pfam | PF00034 |
---|---|
ID pfam | Cytochrom_C |
Seed | 47 |
All | 156000 |
Swiss-Prot | 244 |
Domain Architectures | 984 |
Taxonomy: eukaryota | 5905 |
Taxonomy: archaea | 141 |
Taxonomy: bacteria | 143024 |
3D structures | 332 |
Выравнивание seed с точки зрения гомологичности всех последовательностей или их подмножества
Говорить о ходе эволюции белков очень сложно, исходя из данного выравнивания, так как очень мало достоверных блоков, которые были бы консервативны в приличных обхемах. В выравнивании же очень много гэпов и несостыкующихся аминокислот.
Выравнивание seed | 47 последовательностей, 158 колонок в выравнивании |
---|---|
Максимальный достоверный блок, включающие ВСЕ последовательности (МДБ-all) | 21-25 |
100% консервативные колонки в МДБ-all | 21, 24, 25 |
Максимальный достоверный блок, включающий НЕ ВСЕ последовательности (МДБ-notAll) | 76-78 |
100% консервативные колонки в МДБ-notAll | 76, 78 |
Участок выравнивания, в котором нет никаких достоверных подблоков, и потому маловероятно, что выравнивание на этом участке отражает ход эволюции. | 83-117 |
Карта локального сходства (dotplot) двух последовательностей с одним и тем же доменом, но с разной доменной архитектурой
Из-за того, что для выбранного мной домена сервер выдает ошибку для любой доменной архитектуры, пришлось выбрать другой домен. Им стал - PF00534.
Доменная архитектура 1 | PF13524 - IPR001296 (Glyco_trans_1_2 - Glyco_trans_1) |
---|---|
Белок с архитектурой 1 | G7ZIY8_AZOL4 |
Доменная архипектура 2 | IPR031814 - IPR031814 - IPR001296 (ALG11_N - Glyco_trans_1) |
Белок с архитектурой 1 | B5Y3C6_PHATC |
На карте можно увидеть, что длина найденного выравнивания сильно меньше длины домена, следовательно большая часть домена сильно видоизменена. Провела дополнительное исследование: поставила длину слова BLAST 2 (а не 3), но заметных изменений не произошло, значит параметры BLAST не сильно влияют на полученные результаты. Можно утверждать, что архитектуры точно разные.
Приятное дополнение от маленькой длины выравнивания: прямая сплошная, а значит нет гэпов.