Эволюция доменной архитектуры




Занятие 10. Эволюция доменной архитектуры

Характеристика эволюции архитектуры белков, его включающих

В результате отбора по нужным показателям был выбран домен моего белка PF00381

Характеристика домена в соответствии с БД Pfam
AC ID Функция Число разных доменных архитектур с этим доменом Число представителей по таксонам высшего порядка
(царствам - если представлен в разных царствах)
Cсылка на страницу домена в Pfam

PF00381

PTS-HPr

Небольшой цитоплазматический белок является компонентом фосфоенолпируват-зависимой фосфотрансферазной системы сахара

35

Среди Бактерий - 2074 видов, Архей - 8 видов, Эукариотов - 5 видов

http://pfam.sanger.ac.uk/family/PF00381


Выравнивание для выбранного домена

3D структуру одного домена PTHP_STACA (P23534)

Характеристика выбранных доменных архитектур A0NUU2 и B0GQU5 с общим доменом PTS-HPr (PF00381), который является компонентом сайта фосфорилирования

Характеристика доменных архитектур в соответствии с БД Pfam
AC Число представителей Характеристика других доменов Изображение

A0NUU2

Domain_number=1,
Sequence_length=94,
Pfam_seq_num=5246

Других доменов не содержит

B0GQU5

Domain_number=2,
Sequence_length=377,
Pfam_seq_num1=5246 и
Pfam_seq_num2=11243

Домен PTS_EIIA_2 принадлежит фосфоенолпируват-зависимой фосфотрансферазной системе сахара


Таблица с информацией об архитектуре всех последовательностей, содержащих выбранный домен

Филогенетическое дерево выборки последовательностей домена

Скобочная формула

Реконструированное дерево при помощи программы Mega:

Условные обозначения:
1 - однодоменная архитектура
2 - двудоменная архитектура
B - Bacteria

Филогенетическое дерево построено на основе выравнивания c учетом молекулярных часов, так как представители одного царства, из недалеких таксонов. Лучшим способом построения дерева является метод UPGMA, принимающий на вход матрицу расстояний. По дереву видно деление на 4 ветви согласно архитектуре, хотя и не явное.
Возможно сначала был однодоменный белок у бактерий, а затем архитектура усложнилась путем слияния двух белков с доменами PTS-HPr и PTS_EIIA_2. Среди двухдоменных архитектур достаточно хорошее разделение, а среди однодоменных не все представители Proteobacteria отделились от остальных групп.
Выравнивание было разделено на две группы: отдельно однодоменные и двухдоменные представители.

Профили

Профили для двух групп архитектур:
Однодоменные
Двухдоменные

Графики зависимости ошибок первого и второго рода от порогового значения:

Для первого домена


Для второго домена




Результаты поиска для доменов
№ Домена Пороговый score False Negatives False Positives True Negativies True Positives

1

13.2

3

0

15

21

2

14.3

0

0

24

15



Поиск при помощи полученных профилей по банку SwissProt

Для первой архитектуры нашлось 46 последовательностей до выбранного порогового значения. Они однодоменные и все принадлежат к первой архитектуре, по которой строился профиль. Соответственно среди находок нет последовательностей, принадлежащих к архитектурам, не представленным в первоначальном выравнивании.
Для двухдоменной архитектуры нашлось 7 последовательностей до выбранного порогового значения. Они все принадлежат ко второй архитектуре, по которой строился профиль, кроме одного - он содержит только первую архитектуру. Среди находок нет последовательностей, принадлежащих к архитектурам, не представленным в первоначальном выравнивании.

При увеличении порогового значения, скажем, до 100, число находок резко возрастает, и они часто представленны другими архитектурами, отличными от исследуемых. Например, Q6PD03 содержит домен B56 (сем-во серин/треонин-фосфотаз),
Q9H2F3 содержит домен 3Beta_HSD (3 бета-гидроксистероидный дегидрогеназный тип)
Q5REB0 содержит домен Aminotran_1_2 (сем-во аспартат аминотрансфераз).

Профили получились хорошие. Профиль для архитектуры 1 эффективней при поиске, чем профиль 2 архитектуры. Тот факт, что в случае поиска по профилю второй архитектуры нашлись последовательности первой архитектуры, объясняется схожестью строения архитектур. Если исходить из рассчета чувствительности, то для первой архитектуры она равна 87.5%, в то время как для второй она составляет 1. Специфичность у обеих архитектур составляет по 1.


©Андреянова Екатерина