Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2017

Указания к заданию 11

Задача 1: выбор объектов и получение выравнивания

Все домены и доменные архитектуры определяются в соответствии с БД Pfam.

Прочитайте указания до конца, прежде чем начинать работу: есть ряд ограничений на то, какое семейство доменов стоит выбрать для изучения.

Варианты выбора:

Рекомендуемые ограничения на домен

Необходимую для выбора домена информацию см. на сайте Pfam (со страницы домена ссылки Domain organisation, Species → Tree, Structures).

Действия

Запустите JalView. Для выбранного семейства доменов:

Достаточно выбрать две архитектуры.

Рекомендуемые ограничения на архитектуру

Рекомендуемые действия

Подтаксоны должны быть достаточно представлены последовательностями c выбранными архитектурами (не менее 20 последовательностей с каждой из архитектур в каждом из подтаксонов; если такие подтаксоны и архитектуры подобрать не получается, выберите другое семейство доменов). Рекомендуется в качестве таксона выбрать надцарство (Archaea, Bacteria, Eukaryota). Другой хороший вариант: взять в качестве таксона все "cellular organisms", а два или все три надцарства – как подтаксоны. Следует придумать буквенные коды (X,Y,...) для выбранных подтаксонов, чтобы отображать их на листьях дерева.

Действия

В основной таблице (всех представителей семейства доменов):

В выравнивании:

Задача 2: построение филогенетического дерева домена

Важно: выравнивание должно содержать не полноразмерные последовательности белков, а фрагменты, представляющие домены общего для всех семейства!!!

Построение дерева по выравниванию последовательностей многодоменных белков с разной доменной архитектурой бессмысленно, так как, очевидно, сходство по домену, которого нет в последовательностях с другой доменной архитектурой, обеспечит разделение на ветви по доменным архитектурам вне зависимости от хода эволюции.