Характеристика домена в соответствии с БД Pfam |
AC | ID | Функция | Число разных доменных архитектур с этим доменом | Число представителей по таксонам высшего порядка (царствам - если представлен в разных царствах) |
Cсылка на страницу домена в Pfam |
PF00381 |
PTS-HPr |
Небольшой цитоплазматический белок является компонентом фосфоенолпируват-зависимой фосфотрансферазной системы сахара |
35 |
Среди Бактерий - 2074 видов, Архей - 8 видов, Эукариотов - 5 видов |
http://pfam.sanger.ac.uk/family/PF00381 |
Выравнивание для выбранного домена
3D структуру одного домена PTHP_STACA (P23534)
Характеристика доменных архитектур в соответствии с БД Pfam |
AC | Число представителей | Характеристика других доменов | Изображение |
A0NUU2 |
Domain_number=1, |
Других доменов не содержит |
|
B0GQU5 |
Domain_number=2, |
Домен PTS_EIIA_2 принадлежит фосфоенолпируват-зависимой фосфотрансферазной системе сахара |
|
Таблица с информацией об архитектуре всех последовательностей, содержащих выбранный домен
Реконструированное дерево при помощи программы Mega:
Условные обозначения:
1 - однодоменная архитектура
2 - двудоменная архитектура
B - Bacteria
Филогенетическое дерево построено на основе выравнивания c учетом молекулярных часов, так как представители
одного царства, из недалеких таксонов. Лучшим способом построения дерева является метод UPGMA, принимающий
на вход матрицу расстояний. По дереву видно деление на 4 ветви согласно архитектуре, хотя и не явное.
Возможно сначала был однодоменный белок у бактерий, а затем архитектура усложнилась путем слияния двух белков
с доменами PTS-HPr и PTS_EIIA_2. Среди двухдоменных архитектур достаточно хорошее разделение, а среди
однодоменных не все представители Proteobacteria отделились от остальных групп.
Выравнивание было разделено на две группы: отдельно однодоменные и двухдоменные представители.
Профили для двух групп архитектур:
Однодоменные
Двухдоменные
Графики зависимости ошибок первого и второго рода от порогового значения:
Для первого домена
Для второго домена
Результаты поиска для доменов |
№ Домена | Пороговый score | False Negatives | False Positives | True Negativies | True Positives |
1 |
13.2 |
3 |
0 |
15 |
21 |
2 |
14.3 |
0 |
0 |
24 |
15 |
Поиск при помощи полученных профилей по банку SwissProt
Для первой архитектуры нашлось 46 последовательностей до выбранного порогового значения.
Они однодоменные и все принадлежат к первой архитектуре, по которой строился профиль.
Соответственно среди находок нет последовательностей, принадлежащих к архитектурам,
не представленным в первоначальном выравнивании.
Для двухдоменной архитектуры нашлось 7 последовательностей до выбранного порогового значения.
Они все принадлежат ко второй архитектуре, по которой строился профиль, кроме одного - он содержит только первую архитектуру.
Среди находок нет последовательностей, принадлежащих к архитектурам, не представленным в первоначальном выравнивании.
При увеличении порогового значения, скажем, до 100, число находок резко возрастает,
и они часто представленны другими архитектурами, отличными от исследуемых. Например,
Q6PD03 содержит домен B56 (сем-во серин/треонин-фосфотаз),
Q9H2F3 содержит домен 3Beta_HSD (3 бета-гидроксистероидный дегидрогеназный тип)
Q5REB0 содержит домен Aminotran_1_2 (сем-во аспартат аминотрансфераз).
Профили получились хорошие. Профиль для архитектуры 1 эффективней при поиске, чем профиль 2 архитектуры. Тот факт, что в случае поиска по профилю второй архитектуры нашлись последовательности первой архитектуры, объясняется схожестью строения архитектур. Если исходить из рассчета чувствительности, то для первой архитектуры она равна 87.5%, в то время как для второй она составляет 1. Специфичность у обеих архитектур составляет по 1.