Главная

Эволюционные домены. Банки Pfam и InterPro.


Упражнение 1. Описание доменной архитектуры моего белка в соответствии с банком Pfam.

С главной страницы Pfam доступны разные виды поиска. В частности, "JUMP TO" позволяет искать по ID белка.

Доменная структура белка DACC_BACSU по данным Pfam

Cхема из Pfam:
Пояснения к схеме
Pfam AC Pfam ID Полное название семейства доменов
Положение в последовательности белка DACC_BACSU Клан
1. P39844 Peptidase_S13 Семейство доменов названо по названию пептида S13 36–491 Клан Beta-lactamase (CL0013), содержит 16 семейств, из которых у всех известна функция.

Упражнение 2. Выбор одного из доменов моего белка и приведение данных о нем

Домен Peptidase_S13 входит в 6 разных архитектур.
Для 1999 белков, содержащих домен, известна последовательность.
Для 2 разных белков, содержащих домен, определена пространственная структура.
Сохранила выравнивание "seed" фрагментов белков, соответствующих домену. ( PF02113_seed.msf )

Упражнение 3. Выбор доменной архитектуры, в которой присутствует два или более разных домена. Описаник, как часто и в каких организмах встречаются домены по отдельности.

Мой белок DACC_BACSU 1 активный домен.Выбираю доменную архитектуру - Peptidase_S13, Amidohydro_5, Amidohydro_3, D-aminoacyl_C.
Изображение Далее открыла страничку домена. Перешла по ссыке "Species", далее — "Tree". Выбрала "Expand to depth" = 2. Результаты о встречаемости доменов в таксонах представила в виде таблицы.

Представленность домена PF02113 в организмах разных таксонов

Таксон
Количество белков с доменом PF02113
Эукариоты Зеленые растения
2
Грибы
-
Животные
-
Остальные эукариоты
5
Археи
7
Бактерии
1503
Вирусы
-

Представленность домена PF02113 достаточно небольшая. Отсуствует у животных, грибов и вирусов. Зато у бактерий 1503.

Представленность домена PF13594 в организмах разных таксонов

Таксон
Количество белков с доменом PF02113
Эукариоты Зеленые растения
16
Грибы
92
Животные
57
Остальные эукариоты
16
Археи
99
Бактерии
2352
Вирусы
-

Представленность домена PF13594 знаительно больше, но также нет среди вирусов.

Представленность домена PF07969 в организмах разных таксонов

Таксон
Количество белков с доменом PF02113
Эукариоты Зеленые растения
48
Грибы
129
Животные
10
Остальные эукариоты
15
Археи
139
Бактерии
3366
Вирусы
-

Представленность домена PF07969 также велика. Но опять отсутствует у вирусов.

Представленность домена PF07908 в организмах разных таксонов

Таксон
Количество белков с доменом PF02113
Эукариоты Зеленые растения
-
Грибы
5
Животные
-
Остальные эукариоты
-
Археи
6
Бактерии
591
Вирусы
-
Представленность домена PF07908 значительно меньше по сравнению с другими доменами. Отсутствует у зеленых растений, животных, остальных эукариот, вирусов.

Упражнение 4. Сравнение описания мотивов в разных банках семейств, по данным InterPro.

Открыла главную страничку InterPro. По идентификатору UniProt моего белка нашла описание всех подписей (signatures), интегрированных в InterPro, т.е. имеющих InterPro ID.
В результате получила Изображение
1)Самый короткий мотив называется DADACBPTASE3. InterPro ID:IPR000667.
Он описан в банках Pfam,Prints, TIGRFAMs. Тип распространяющего правила:семейство(Family).
2)Самый длинный мотив называется PBP_transp_fold. InterPro ID:IPR012338.
Он описан в банках Gene3D, SuperFamily.Тип распространяющего правила:домен.
В InterPro также интегрированы следующие структурные подписи:3.40.710.10 (1w5dA01),e.3.1.3 (d1w5da1), 1w5dA.
Границы структурных доменов уже, по сравнению с границами доменов Pfam.
©Eliseeva Julia