Домены. Pfam. HMM профиль.

Задача 1: выбор объектов и получение выравнивания.

1. Выбор семейства доменов.

Для работы был выбранн домен PF01302 (Pfam AC), CAP-Gly domain (Pfam ID).
Это белки, ассоциированные с цитоскелетом, которые участвуют в организации микротрубочек, транспортировке везикул и органелл.
Домен встречается в 7841 последовательностях.
Далее в программе Jalveiw было открыто выравнивание всех последовательностей содержащих выбранный домен.
Проект выравнивания: pr11t4.jvp. Все раскрашено с помощью ClustalX.

2. Выбор архитектур.

Ниже представленны выбранные для работы доменные архитектуры:

Сводная таблица с информацией об архитектуре всех последовательностей, содержащих выбранный домен.

3. Выбор таксона и подтаксонов.

Был выбран таксон Metazoa (Животные), а также подтаксоны Hexapoda (Шестиногие: насекомые, скрыточелюстные) и Vertebrata (Позвоночные).

4. Выбор представителей архитектур.

Далее в той же таблице были отобраны последовательности по нужным таксону и подтаксонам (лист "итог").
Эти последовательности были выровнены в JalView, разделены по группам и окрашены по ним.
Пустые и неинформативные столбцы, короткие фрагменты были удалены из выравнивания.
Итоговый проект JalView.
Выравнивание содержит некоторое количетво консервативных регионов, поэтому можно назвать его заслуживающим доверия.

Задача 2: построение филогенетического дерева домена

Доменные архитектуры были закодированы как 1 и 2 (однодоменные и двудоменные).
Сравниваемые таксоны были закодированы как (V - Vertebrata, H - Hexapoda).
Далее было построено филогенетическое дерево:


Разделение по архитектуре домена является вполне различимым, что может означать формирование архитектур
до формирования таксонов, т.к. нет строгого разделения.
Случайные появления однодоменных архитектур в синем разделе и двухдоменных в красном могут
быть приписаны ошибкам в базе данных Pfam.

Скобочная формула:

(((((((((((((2_V_A0A093HHD1/1-66,2_V_A0A0Q3TMT9/1-66),2_V_A0A091Q4U8/1-66),2_V_A0A091S3C1/1-66),
(2_V_A0A093GTR1/1-66,(2_V_A0A099ZIU7/1-66,2_V_A0A091TSM3/1-66))),(2_V_A0A091PGF5/1-66,2_V_A0A093H5C5/1-66)),
2_V_A0A093Q0P4/1-66),(2_V_A0A151M2W4/1-66,(2_V_A0A0G2K191/1-66,1_V_A0A091DT60/1-66))),1_H_A0A0J7L128/1-67),
1_H_A0A0N1I4V6/1-66),((((2_V_A8DZJ0/1-69,2_V_A0A0F8BBX7/1-69),2_H_A0A0T6AZV4/1-69),(2_V_A0A151MLE3/1-69,
2_V_A0A0D9QW67/1-69)),((((2_H_A1ZBM2/1-69,2_H_B3MHB0/1-69),2_H_A0A0L0C5Z9/1-69),2_H_A0A084VLU0/1-69),
((2_H_A0A194PXM3/1-69,2_H_A0A194RJH0/1-69),(2_H_A0A0N0U5B1/1-69,(2_H_A0A0J7KUI4/1-69,(2_H_A0A151X261/1-69,
2_H_A0A158P277/1-69))))))),((1_H_A0A0J7KVF8/1-66,1_H_A0A0N1PJW7/1-66),(1_V_A0A087RI17/1-66,
(1_V_A0A087XES2/1-66,1_V_A0A087XTH4/1-66)))),((1_V_A0A091DKJ8/1-66,1_V_A0A087RE93/1-66),
(1_V_A0A087VA81/1-65,1_V_A0A087RA24/1-65))),(1_H_A0A0J7KHG2/1-66,(1_H_A0A0B4KG24/1-66,1_H_A0A0B4LGK5/1-66)),
((((1_V_A0A091DL42/1-65,1_V_A0A087RB07/1-65),1_V_A0A087XLL1/1-65),(1_V_A0A087V740/1-65,1_V_A0A087QWK0/1-65)),
(((((1_V_A0A087VN36/1-65,1_V_A0A087QVI9/1-65),1_V_A0A087XRP7/1-65),(1_V_A0A087XMT0/1-65,
(1_V_A0A091DKJ8/1-65,1_V_A0A087RE93/1-65))),(1_V_A0A087XMT0/1-65,(1_V_A0A087RE93/1-65,1_V_A0A091DKJ8/1-65))),
((((1_V_A0A087RB07/1-65,1_V_A0A091DL42/1-65),1_V_A0A087XLL1/1-65),(1_V_A0A087V740/1-65,1_V_A0A087QWK0/1-65)),
(1_H_A0A067RCV7/1-65,((1_H_A0A084VMC0/1-78,1_H_A0A0J7KWP2/1-71),(1_H_A0A0J7KGV3/1-68,1_H_A0A0N0PCT2/1-77)))))));

Вернуться на главную страницу


© Наумова Юлия, 2019