Эволюционные домены. Банки Pfam и InterPro.

Доменная архитектура белка YojM_BACSU в соответсвии с банком Pfam

В банке данных Pfam был проведён поиск доменов, содержащихся в белке TENA_BACSU. Результаты представлены в таблице 1.

Таблица 1. Доменная структура белка TENA_BACSU по данным Pfam

Cхема из Pfam:
Пояснения к схеме
Pfam AC Pfam ID Полное название семейства доменов Положение в последовательности белка TENA_BACSU Клан
1. PF03070 TENA_THI-4 TENA/THI-4/PQQC семейство - названо в честь белков, увеличивающих экспрессию внеклеточных ферментов (щелочной протеазы, нейтральной протеазы) и белков участвующих в биосинтезе тиамина. Представители этого семейства встречаются в 3х важнейших филлумах: архебактерий, эубактерий и эукариот. С-концевые участки представителей семейства значительно схожи между собой. 8–215 Клан HO (CL0230) содержит 5 семейств, включая TENA_THI-4.

Описание домена TENA_THI-4 (PF03070)

Описание доменной архитектуры: TENA_THI-4, Phos_pyr_kin

Для анализа была выбрана доменная архитектура, состоящая из 2 доменов: TENA_THI-4 и Phosphomethylpyrimidine kinase. В таблице 2 можно ознакомиться с тем, как часто и в каких организмах встречается каждый из доменов.

Таблица 2. Представленность доменов в организмах разных таксонов

Таксон
Количество белков с доменом TENA_THI-4 (PF03070)
Количество белков с доменом Phos_pyr_kin. (PF08543)
Эукариоты Зеленые растения 77 27
Грибы 267 136
Животные 4 32
Остальные эукариоты 12 38
Археи 145 139
Бактерии 2716 3983
Вирусы 0 0

Примечательно, что ни один из этих доменов не распространен среди вирусов. Чаще всего домены встречаются среди бактерий.

Сравнение описаний мотивов в разных банках семейст по даным InterPro

На сервере Европейского Биоинформатического Института сервисом InterPro найдены все подписи белка TENA_BACSU (изображение можно посмотреть на рисунке 2).

Рисунок 2. Разметка мотивов InterPro белка TENA_BACSU

Некоторые пояснения:

В InterPro интегрированы 2 структурные подписи: Thiaminase-2/PQQ biosynthesis protein C и Haem oxygenase-like, multi-helical. Запись Thiaminase-2/PQQ biosynthesis protein C почти не отличается от таковой в Pfam: в Pfam граница домена TENA_THI-4 начиналась на 2 аминокислоты раньше и заканчивалась на одну аминокислоту позже (TENA_THI-4 - 8-215; Thiaminase-2/PQQ biosynthesis protein C - 10-214) Запись Haem oxygenase-like, multi-helical больше таковой записи в Pfam ( точнее границы записи в InterPro, охватывают границы записи в Pfam )

© Nosikova Kate, 2012