|
|||||||||||||||||||||||
Выбор объектов и получение выравнивания Для выполнения практикума взят домен zf-MIZ (ID в базе данных Pfam: PF02891). Это один из видов цинковых пальцев - ДНК-связывающего домена. Для данного домена известно:
Непосредственно с Pfam было получено выравнивание семейства:
Рис. 1. Выбранные доменные архитектуры Для дальнейшей работы были выбраны архитектуры с рисунка 1. Одна содержит, помимо zf-MIZ, домен SAP, а другая - еще и домен PINIT. Был запущен скрипт:
architecture.txt - был перенесен в Excel. Были скачаны полные записи всех последовательностей с Uniprot Retrieve. Файл с последовательностями был подан скрипту:
Информация из полученного файла была добавлена к сводной таблице architecture.xlsx. По данным из сводной таблицы отобраны представители архитектур так, чтобы в 2-х подтаксонах было не менее 5 представителей 2-х выбранных архитектур. Выбраны подтаксоны:
Выбранные последовательности были переданы Uniprot Retrieve. Полученные fasta были выровнены в Jalview - проект. Построение филогенетического дерева домена Дерево было построено алгоритмом Neighbour Joining cо 100 бутстреп-репликами по модифицированному файлу с выравниванием. Спереди к названиям последовательостей добавлены обозначения такономии (выше) и обозначения архитектуры - 1 или 2. Рис. 2. Дерево Скобочная формула делрева: файл Видно, что хорошо разделились грибы и животные, а вот разные архитектуры - нет. Профиль Для выполнения этого задания была выбрана клада на дереве, соответствующая 2_М. Ее выравнивание сохранено отдельно в файл .fasta. По нему был построен профиль в HMM:
Профиль калибруется:
Профиль используется для поиска в файле со всеми последовательностями, содержащими домен (результат):
Итог - таблица. Рис. 3. Кривая Порог E value - 0. Таблица 1. Статистические параметры для данного E value
|
|||||||||||||||||||||||
|