Пракикум 11: Множественное выравнивание как отражение эволюции белков

Семейство доменов из Pfam для анализа: PF00034

Цитохромы c — это белки, содержащие гем, который ковалентно присоединён к пептиду через одну или две тиоэфирные связи. Эти связи обычно формируются в мотиве Cys-X-X-Cys-His (CXXCH), где X — любая аминокислота. Цистеин связывается с виниловыми боковыми цепями гема, а гистидин координирует одно из аксиальных мест железа гема. Могут встречаться и другие мотивы связывания. Цитохромы c функционируют как переносчики электронов или катализаторы окислительно-восстановительных реакций. Известный представитель этой группы — митохондриальный цитохром c.

Таблица 1. Описание страницы домена в Pfam
AC pfam PF00034
ID pfam Cytochrom_C
Seed 47
All 156000
Swiss-Prot 244
Domain Architectures 984
Taxonomy: eukaryota 5905
Taxonomy: archaea 141
Taxonomy: bacteria 143024
3D structures 332

Выравнивание seed с точки зрения гомологичности всех последовательностей или их подмножества

Говорить о ходе эволюции белков очень сложно, исходя из данного выравнивания, так как очень мало достоверных блоков, которые были бы консервативны в приличных обхемах. В выравнивании же очень много гэпов и несостыкующихся аминокислот.

Таблица 2. Описание выравнивания seed
Выравнивание seed 47 последовательностей, 158 колонок в выравнивании
Максимальный достоверный блок, включающие ВСЕ последовательности (МДБ-all) 21-25
100% консервативные колонки в МДБ-all 21, 24, 25
Максимальный достоверный блок, включающий НЕ ВСЕ последовательности (МДБ-notAll) 76-78
100% консервативные колонки в МДБ-notAll 76, 78
Участок выравнивания, в котором нет никаких достоверных подблоков, и потому маловероятно, что выравнивание на этом участке отражает ход эволюции. 83-117

Карта локального сходства (dotplot) двух последовательностей с одним и тем же доменом, но с разной доменной архитектурой

Из-за того, что для выбранного мной домена сервер выдает ошибку для любой доменной архитектуры, пришлось выбрать другой домен. Им стал - PF00534.

Таблица 3.
Доменная архитектура 1 PF13524 - IPR001296 (Glyco_trans_1_2 - Glyco_trans_1)
Белок с архитектурой 1 G7ZIY8_AZOL4
Доменная архипектура 2 IPR031814 - IPR031814 - IPR001296 (ALG11_N - Glyco_trans_1)
Белок с архитектурой 1 B5Y3C6_PHATC
Рис. 1. Карта локального сходства

На карте можно увидеть, что длина найденного выравнивания сильно меньше длины домена, следовательно большая часть домена сильно видоизменена. Провела дополнительное исследование: поставила длину слова BLAST 2 (а не 3), но заметных изменений не произошло, значит параметры BLAST не сильно влияют на полученные результаты. Можно утверждать, что архитектуры точно разные.

Приятное дополнение от маленькой длины выравнивания: прямая сплошная, а значит нет гэпов.

Рис. 2. Полученное выравнивание

Placeholder

Практикум 9

Выравнивание как отражение эволюции. Программы парного выравнивания. Jalview

Тык

Placeholder

Практикум 10

Программа BLAST

Тык

Placeholder

Практикум 12

Алгоритмы и программы множественного выравнивания. Базы гомологичных доменов

Тык