 |
Занятие 6. Домены. БД Pfam, InterPro.
- Исследование доменной структуры белка NadB_Ecoli
- Доменная структура белка NadB_Ecoli по данным Pfam
В БД Pfam было найдено описание доменной организации моего белка.
Резудьтат поиска прдеставлен в таблице:
Доменная структура белка NadB_Ecoli по данным Pfam
Cхема из Pfam:
|
Пояснения к схеме
|
№ |
Pfam AC |
Pfam ID |
Полное название семейства домена
|
Положение в последовательности белка хххх_Ecoli |
Клан |
1. |
PF00890 |
FAD_binding_2 |
ФАД-связывающий домен 2
|
10-392 |
Клан NADP_Rossmann (CL0063),
содержит 148 сем-ва,
у 15-ти неизвестна функция
|
2. |
PF02910 |
Succ_DH_flav_C |
Сукцинат дегидрогеназа-флавопротеин, С-концевой домен;
принимает участие в аэробном росте |
440-526 |
нет |
- Выравнивание-затравка (seed) для N-концевого домена моего белка (PF00890) в формате msf:
FAD_binding.msf.
- Сравнение описания доменной структуры в Pfam с описанием в других БД
В БД InterPro был проведен поиск доменов моего белка.
По результатам поиска были выбраны описания
всех подписей (signatures), интегрированных в InterPro, т.е. имеющих InterPro ID.
Подпись, которая, на мой взгляд, наиболее отличается от подписей PFAM:

Это подпись из БД PRINTS, ее InterPro ID: IPR013027.
Как видно из картинки, подпись содержит два небольших мотива.
Также InterPro содержит еще одну подпись, которая отличается от подписей PFAM:

БД TIGRFAMs, InterPro ID: IPR005288.
Этот домен является как бы объединением доменов FAD_binding 2 и Succ_DH_flav_C из Pfam.
- Сопоставление доменной структуры с 3D структурой моего белка
Из Pfam было получено изображение 3D-структуры белка NadB_Ecoli
(1knp.pdb):

Розовым цветом выделен домен Succ_DH_flav_C, зеленым - FAD_binding 2. Структура в шарнирной модели - это лиганд флавинадениндинуклеотид.
Домен FAD_binding 2 покрывает практически всю структуру, состоящую из бета-листов и альфа-спиралей. Домен Succ_DH_flav_C занимает 2 полные
альфа-спирали и половину 3, и, таким образом, не покрывает структурный домен полностью. Еще одна альфа-спираль не попадает ни под один из доменов Pfam.
- Исследование эволюции отдельных доменов
- Частота встречаемости домена Succ_DH_flav_C белка NadB_Ecoli в различных организмах
Домен FAD_binding_2 (PF00890)встречается в 1110 видах.
Домен Succ_DH_flav_C (PF02910) встречается в 910 видах. По данным из его таксономического дерева PFAM была заполнена таблица:
Представленность домена PF02910 в организмах разных видов
Таксон
|
Количество белков с доменом PF02910
|
Эукариоты |
Зеленые растения |
43 |
Грибы |
59 |
Животные |
106 |
Остальные эукариоты |
43 |
Бактерии |
2733 |
Археи |
98 |
Как видно из таблицы домен Succ_DH_flav_C широко представлен как у прокариот, так и у эукариот.
- Частота встречемости доменов, представленных в белке NadB_Ecoli, в Escherichia coli K12
Представленность изучаемых доменов в белках Escherichia coli (strain K12)
№ |
PFAM ID |
Количество белков в Escherichia coli (strain K12) |
1. |
PF00890 |
4 |
2 |
PF02910 |
3 |
Количество белков с точно такой же доменной организацией как у NadB_Ecoli: 2 (FRDA_ECOLI и DHSA_ECOLI).
Из таблицы видно, что оба домена встречаются в кишечной палочке довольно редко.
- Доменные перестройки
Домен PF02910 (FAD_binding_2) встречается в сочетании с разными доменами, причем бывает как на N-, так и на С-конце последовательности.
Q24U83_DESHY:  Q8RPI7_DESHA: 
Также он встречается в однодоменных белках:
3O1D_COMTE: 
В некоторых белках домен дуплицирован: C5LJM5_9ALVE: 
Как видим, последний домен состоит только из некоторой части изучаемого домена.
Также встречаются белки, в которых последовательность домена имеет разрыв. Пример: C2DYT0_9LACO: 
Домен PF00890 (Succ_DH_flav_C) встречается как в многодоменных вариантах, так и в одноменных:
DHSA1_ARATH  Q8ZUX3_PYRAE : 
Иногда встречаются дупликации домена:
B8BFH4_ORYSI: 
|
|
|