Домены. Pfam. HMM профиль
Задание 1: выбор объектов и получение выравнивания
Для выполнения заданий Практикума я выбрала домен zf-MIZ, который в БД Pfam имеет
AC PF02891.
Имя MIZ является производным от
Msx-
interacting-
zinc finger. В молекулярной биологии MIZ-type zinc finger domain
является цинковым палецем, одним из ДНК-связывающих доменов.
Этот домен имеет SUMO (маленький убиквитино-подобный модификатор) лигазную активность и участвует в связывании ДНК и организации хромосомы.
Что известно для днного домена:
- 36 архитектур
- 2295 последовательностей
- 1 взаимодействие
- 765 видов
- 8 структур
|
Рис.1 Cтруктура MIZ1 zinc finger protein
|
JalView-выравнивание этого домена доступно для просмотра по
ссылке
Были выбраны две доенные архитектуры(Рис.2). Помимо домена zf-MIZ в них присутствуют также домены
PRINIT(Домен PINIT - это домен белка, который содержится в белках PIAS) и в одной из них -
домен SAP(SAP (после SAF-A / B, Acinus и PIAS) мотив является предполагаемой ДНК/РНК-связывающей областью,
обнаруженной в различных ядерных и цитоплазматических белках).
Рис.2 Доменные архитектуры

С помощью команды, запускающей скрипт swisspfam_to_xls.py
python swisspfam_to_xls.py -p PF02891 -i /srv/databases/pfam/swisspfam.gz -z -o architect.txt
я отобрала последовательности с указанным доменом и составила таблицу для Excel.
В список последовательностей были добавлкны колонки с информацией о таксономической принадлежности с помощью
команды, запускающей скрипт uniprot_to_taxonomy.py:
python uniprot-to-taxonomy.py -i tax.txt -o taxon.txt
В качестве подтаксонов я выбрала Царство Грибов( Fungi ), далее обозначим как F, и Подцарство Многоклеточные( Metazoa ),
далее обозначим как M.
Сводная Exel-таблица, содержащая также AC выбранных последовательностей доступна по
ссылке.
Далее с помощью Uniprot Retrieve получили fasta-последовательности для выравнивания в
JalView.
Всего было загружено 48 последовательностей, но я удалила 7 самых длинных. В выравниваниях выделяются заметные консервативные блоки,
которые примерно соответствуют расположению доменов.
Задание 2: построение филогенетического дерева домена
Дерево было построено алгоритмом Neighbour Joining cо 100 бутстреп-репликами. 1 и 2 - доменные архитектуры с Рис.1 соответственно;
F - Fungi и M - Metazoa. Цвета: 1 M - желтый, 2 M - красный, 1 F - голубой, 2 F - синий.
Рис.2 Филогенетическое древо

Скобочная формула древа:
((((((((((((2_M_A0A0P9ADX7,2_M_A0A0P9BXJ2),2_M_A0A0P8ZNG5),2_M_A0A0P8YAX9),2_M_A0A0P8Y3B5),2_M_A0A0P8XNM6),2_M_A0A0N8P059),(2_M_A0A0B4JCQ7,(2_M_A0A0B4JD03,(2_M_A0A0B4JD33,(2_M_A0A0B4K6T9,2_M_A0A0B4LEH9))))),2_M_A0A084WDP8),(1_M_A0A026WYJ3,1_M_A0A067R5Z0)),((1_M_A0A087T916,1_M_A0A087TYN7),(1_M_A0A087R5P1,(1_M_A0A087R0C6,(1_M_A0A087R1T9,(1_M_A0A087R4B5,1_M_A0A087V9Q2)))))),1_F_A0A016U6L0),1_M_A0A068YA98,((((1_F_A0A067NS21,1_M_A0A067Q905),1_F_A0A067MDV7),1_F_A0A066WHY8),(2_F_A0A163EHD2,(((1_F_A0A010QR10,1_F_A0A066XL56),1_F_A0A014PQX5),((((2_F_A0A0F7V9K6,2_M_A0A0F7VEY7),1_F_A0A017SJY1),1_F_A0A059JFL5),(2_F_A0A0C9LMZ3,(2_F_A0A074YD92,(2_F_A0A074Y8J2,(2_F_A0A074VD10,2_F_A0A074WS47)))))))));
Видно, что разделение грибов и животных прошло достаточно хорошо. А вот разные архитектуры заметно разделились только для животных, грибы
имеют несколько перемешанный вид, но все-таки обособлены малыми группами.
Из-за подобного разделения можно предположить, что сначала имело место разделение на таксоны, а уже после на доменные архитектуры.
Кроме того, стоит помнить о том, что малая часть последовательностей, выходящая за рамки нормы, отсеялась на стадии Bootstrap-анализа.
На Главную страницу
На страницу Семестра