Эволюционные домены.
Банки Pfam и InterPro.

№1.Описать доменную архитектуру белка ACP_BACSU в соответствии с банком Pfam.

Доменная структура белка ACP_BACSU по данным Pfam

Cхема из Pfam:
Пояснения к схеме
Pfam AC Pfam ID Полное название семейства доменов Положение в последовательности белка ACP_BACSU Клан
1. PF00550 PP-binding Phosphopantetheine (фосфопантеиновая) => PP attachment site (связующая группа) => binding

4'-фосфопантеиновая связующая ("протезная") группа прикрепляется через а.о. серина.
Она действует как "качающийся рычаг", помогая связыванию активированных жирных кислот с аминокислотными группами.
Этот домен образует пучок из четырех спиралей.
Cемейство включает в себя белки, не входящие в Prosite, на основании анализа последовательностей и функциональных особенностях.
В родственном домене P19828 связующий серин замещен на аланин.
6–73, причем с 38–54 расположен участок малой сложности Клан PP-binding (CL0314), содержит 3 семейства DUF1493, PP-binding и Ribosomal_L50


№2. Описание одного из доменов моего белка.



Белок ACP_BACSU содержит только один домен из семейства PP-binding. Опишем его по заданному плану.



Как мы видим, домен входит в 2341 различную архитектуру и встречается в 28748 известных последовательностях.
В разделе Structures содержится 38 белков с определенной пространственной структурой (PDB).
Сохраним выравнивание "seed" фрагментов белков, соответствующих домену.

загрузить файл PF00550_seed.msf

Поинтересуемся, что же это за домен (в качестве критериев оценки выравнивания возьмем вынесенные в презентацию).
Выравнивание приведу в виде принтскрина и не по всем 164 последовательностям (эта часть отражает свойства всего выравнивания).

Честно говоря, я ожидал большего... Похоже, говорить о гомологичности доменов даже с большой натяжкой сложно (придется закрыть глаза на наличие гепа между самыми консервативными остатками, а функциональные группы в начале и конце домена выбирать очент лояльно).

Однако это нас не расстраивает, так как это важный, но не главный критерий для выделения доменов, есть еще сравнение функций и 3D структур.
(кстати, именно последнее, похоже, сыграло большую роль в выделении этого домена, см. картинку)


№3. Описание доменной архитектуры, содержащей два или более различных доменов


Архитектура ACP_BACSU включает единственный домен. Выберем белок с другой архитектурой.

Для изучения подойдет, например, содержащая два домена: AMP-binding, PP-binding. (таких будет 615)
Вот ее структура:

Теперь исследуем оба домена на встречаемость в различных таксонах:

Представленность домена PF00501 и домена PF00550 в организмах разных таксонов

Таксон
Количество белков с доменом PF00501.
Количество белков с доменом PF00550.
Эукариоты Зеленые растения  1108  243
Грибы  3092  1894
Животные  2003  359
Остальные эукариоты  1284  376
Археи  829  0
Бактерии  29053  15634
Вирусы  0  0

Как мы видим, оба домена представлены в основном среди бактерий, а также довольно жироко распространены и среди эукариот. PF00501 встречается еще и среди археев.

В целом о распространенности доменов заметим, что домен PF00501 распространен очень и очень широко, а домен PF00550 встречается несколько реже, но тоже очень распространен.


№4. Сравнение описания мотивов в разных банках семейств по данным InterPro

На главной странице InterPro воспользуемся поиском по ID для нашего белка ACP_BACSU.
На выходе получаем много полезной, но, к сожалению, не проверенной информации, в том числе и всевозможные мотивы белка:


Как мы видим из таблицы, самый короткий мотив состоит всего из 15 остатков (32-47), это мотив "PHOSPHOPANTETHEINE"
он описан в банке PROSITE pattern.

На звание самого длинного претендуют слазу 4 мотива, занимающие все 77 остатков.
Это мотивы:

ACP_like из банка Gene3D
ACP_like из банка SuperFamily
PTHR20863 из банка Panter
PTHR20863:SF13 из банка Panter

В InterPro также интегрированы структурные подписи:
d1f80d (a.28.1.1)
1f80D00 (1.10.1200.10)
2x2bA

По сравнению с Pfam, границы мотива РР-binding не различаются (6-73 в обоих случаях).




назад в проекты


© Aleshin Vasily