Домены. Pfam. HMM профиль.


Задание 1

В данном практикуме у выбрал домен He_PIG.


Таблица 1. Информация о домене
AC PF05345
ID He_PIG
Функция относится к семейству бактериальных гликозилгидролазоподобных белков
Число последовательностей 2759
Число видов 898


В "JalView" было сделано выравнивание семейств доменов: pfam.jvp и pfam.fasta.


Ccылка на страницу доменных архитектур с этим доменом..

Рисунок 1. Выбранные Архитектуры

Помимо выбранного домена первая архитектура содержит следующие домены: FTP (PF07504), Peptidase_M4 (PF01447), Peptidase_M4_C (PF02868), P_proprotein (PF01483). Число последовательностей: 33
Помимо выбранного домена вторая архитектура больше ничего не содержит. Число последовательностей: 20
Ссылка с финальной сводной таблицей.
Были выбраны две группы, относящиеся к таксонам Bacteria и подтаксонам Streptomycelates и Pseudonocardiales.
Ссылка на проект с выравниванием выбранных AC.
Наблюдается множество гэпов в обеих архитектурах. Было удалено много пустых колонок, из-за чего последовательности сильно сократились. Тем не менее наблюдается много консервативных позиций как в 1, так и во 2 архитектуре.

Задание 2

Из рисунка 2 видно, что нет какого-то четкого деления на группы, так как и архитектуры и подтаксоны перемешаны. Из этого можно сделать вывод, что подтаксоны очень близки, однако это затрудняет анализ такого дерева.
Формула этого дерева тут.

Рисунок 2. Филогеническое дерево


© Угольков Ярослав, 2018