Эволюционные домены. Pfam
Дан домен по версии БД Pfam: PF01583(APS_kinase)
Задание
1.Выбрать две доменные архитектуры с данным доменом (назовем их A + B и A + C)
2.Собрать данные для проверки гипотезы: слияние доменов, приведшее к образованию данной доменной архитектуры, произошло в один раз и передавалось по наследству .
3.Сделать вывод о том, подтверждается ли гипотеза, и обосновать его.
Домен A: Аденилатциклаза-сульфат киназа(Аденозин-5'-фосфосульфат киназа)
Это фермент,который катализирует фосфорилирование аденозин-5'-фосфосульфата до 3'-фосфоаденозина-5'-фосфосульфата. Домен содержит АТФ-связывающий мотиф(П-петлю).
ATP + adenylyl sulfate
ADP + 3'-phosphoadenylyl sulfate
Характеристика домена:
1)Найдено 20 различных архитектур;
2)1559 последовательностей с данным доменом;
3)1193 вида с такими последовательностями;
4)Последовательности по царствам :
эукариоты-279
бактерии-1250
археи-26
вирусы-1
Первая доменная архитектура:A+B (PF01583+PF01747)
ATP-sulfurylase, APS_kinase

145 последовательностей с данной архитектурой.
Вторая доменная архитектура:A (PF01583)
APS_kinase

1056 последовательностей с данной архитектурой.
- Была сделана выборка из 21 последовательности белков двух доменных архитектур.
Для этого была создана сводная таблица последовательностей с указанием длины каждой, доменной архитектуры,принадлежности к определенному виду, царству.
(Для отбора нужных последовательностей использовался скрипт swisspfam_to_xls.py .
python swisspfam_to_xls.py -i /srv/databases/pfam/swisspfam.gz -o PF01583.xls -z -p PF01583 )
Excel-файл с выбранными последовательностями
- Было осуществлено выравнивание двух групп последовательностей в пределах домена.
Для того,чтобы оставить в выравнивании Full из БД Pfam только нужные последовательности из 2 групп был использован скрипт filter_alignment.py .
Выравнивание из Pfam
- Методом "neighbor joining" (команды fprotdist и fneighbor ) было построено филогенетическое дерево.

фиолетовый-1 группа
желтый-2 группа
Скобочная формула:
((((1_E_B5DFH4:0.00750,1_E_PAPS2_:0.00537):0.08722,1_E_Q4RJF3:0.08821):0.06192,
(1_B_Q179J5:-0.39357,1_E_Q1PQ26:0.84602):0.17470):0.02674,
((((((((1_E_A3PG80:0.01253,1_E_A4WP51:0.01941):0.04001,1_E_Q07GG0:0.06882):0.22506,
(1_B_A6QV05:0.16877,1_V_MET3_U:0.13140):0.28546):0.07950,
(1_A_B5EN17:0.25722,((2_E_A3NWW3:0.00000,2_E_C0YCJ7:0.00000):0.15595,
(2_E_A4YYA8:-0.91696,2_E_B9M546:2.25001):0.41547):0.30722):0.05847):0.08945,
1_E_SATC2_:0.34156):0.28155,1_V_B3RS50:0.18889):0.08006,
1_E_C4QDG5:0.20813):0.05713,1_V_PAPSS_:0.15968):0.00418,1_E_A0MT20:0.17504);
- Выводы:
Cлияние доменов PF01583+PF01747 скорее всего произошло в один раз и передавалось по наследству. Для домена PF01583 характерно еще несколько архитектур с доменом PF01747, характеризующихся меньшим количеством последовательностей.
Данная сульфат-аденилаттрансфераза является частью бифункционального полипептида,связанного с аденозин-5'-фосфосульфат киназой. Оба фермента необходимы для фосфоаденозин-фосфосульфат синтеза из неорганического сульфата.
Главная страница
Страница четвертого семестра
© Naraykina Yulya,2011