Эволюционные домены


Был выбран домен липазы, точнее семейство панкреатических липаз [Lipase, PF00151]. Это липолитические ферменты, которые гидролизуют сложноэфирную связь в триглицеридах. Липазы широко распространены в животных, растениях и прокариотах. Более подробную информацию можно прочесть здесь.
Для домена известна 31 архитектура.
C помощью скрипта swisspfam_to_xls.py из файла swisspfam.gz, содержащего информацию для всех последовтельностей Uniprot была составлена таблица, содержащая последовательности с указанным доменом. Затем в таблицу добавили столбцы с таксономической принадлежностью: по AC последовательностей получили flat text (Retrieve из Uniprot), а затем перенесли в сводную таблицу.
Для дальнейшей работы были выбраны две доменные архитектуры:
  1. Lipase: 1376 последовательностей;
  2. Lipase, PLAT: 441 последовательность.
    PLAT/LH2 - домен, который часто встречается в белках, связанных с мембраной или липидами. Он опосредует связь с мембранами.

Выбор таксона и подтаксонов

В качество таксона я выбрала Euteleostomi, в качестве подтаксонов - Actinopterygii, Amphibia и Mammalia.
Euteleostomi - успешная группа, вкулючающая 90% современных позвоночных. Относится к челюстноротым. Соответственно, подтаксон Actinopterygii - это класс лучеперых рыб, самый многочиленный класс позвоночных, подтаксон Amphibia - Земноводные, а Mammalia - Млекопитающие. На отдельном листе сводной таблицы записаны идентификаторы, доменная организация и таксономия выбранных мною последовательностей. В выравнивание добавлена последовательность этого домена с известной структурой (последняя строка). Кроме того, выравнивание отредактировано (удалены пустые колонки, плохо выравнивающиеся N- и C-концы, фрагменты вместо целых последовательностей). Вручную подправлено несколько гэпов. Последовательности разделены на 2 группы в соответствии с доменной архитектурой: первая - это архитектура Липаза+PLAT, вторая - Липаза; обе группы покрашены Clustalx и по порогу консервативности 10%.
Полученное выравнивание можно увидеть на рисунке 1 и в файле.

Рис.1. Выравнивание доменов.


Для удобства построения и визуализации филогенетичекого дерева были приняты следующие обозначения:

1 Однодоменая архитектура Lipase
2 Двудоменная архитектура Lipase+PLAT
M Mammalia
Am Amphibia
Ac Actinopterygii

Например, 2_M_ID - это последовательность, относящаяся к архитектуре Lipase+PLAT из Млекопитающих.
Отформатированные последовательности использвали для построения филогенетического дерева в JalView методом NJ Using % Identity.
С использованием сервиса ITOL была создана следующая окраска листьев:

Рис.2. Филогенетическое дерево.


Скобочная формула дерева выглядит следующим образом:
((1_Am_F7CGM7:20.548546,(((Structure:6.653141,2_M_D2H718:6.5491066):8.29822,
(2_Am_B1H305:0.0,(2_Am_Q4KLB6:4.7552147,2_Am_A1L2N3:4.7953453):5.6260815):5.536051):13.883747,
(((1_M_D2I277:9.817097,(2_M_B8XSI5:9.973434,2_M_B8R1K2:9.689484):0.997509):8.251818,
(1_Ac_D3TJK5:15.008562,(1_Am_B0BMB8:0.0,2_Am_B0BMB8:0.0):14.766722):2.8787994):4.8006334,
((((1_M_A7LD44:4.1741905,2_M_D5FGX9:4.8145714):0.7658901,2_M_C0LQ91:4.852087):6.477682,2_Am_Q6P9H9:10.938047):5.873478,
(((((1_Ac_D3TJH3:6.5953827,(1_Ac_A9CQY8:0.0,(1_Ac_D3TJL2:1.7169981,1_Ac_A4F5E8:2.2155886):2.7820292):0.7079849):1.0535545,
2_Ac_C4P238:1.7203236):2.718134,((2_Ac_C1J0C4:2.4020987,2_Ac_C0LLE6:1.8113871):0.8185539,2_Ac_C0LLE5:4.097172):8.21059):3.4634428,
(((1_M_A5HNX8:1.4959726,2_M_A8K2M5:1.5939169):0.8783026,2_M_A0FI82:2.773385):5.7223167,2_Ac_H0YPU5:7.9012794):4.6003284):4.4787464,
2_Ac_A9ZSY7:15.920986):2.582017):2.4637861):6.20018):0.055858612):13.46168,1_Ac_A9JRW4:13.46168);

Обе архитектуры присутствуют во всех выделенных подтаксонах. Это говорит о том, что архитектуры уже присутствовали у их предка. С другой стороны, архитектуры в основном не разделены между собой, то есть чаще на филогенетическом дереве теснее стоят таксоны, а не архитектуры. Скорее всего, это говорит о том, что архитектуры появлялись независимо в разных подтаксонах. Так, например, это демонстрируют Лучеперые рыбы, в которых, по-видимому, дупликация липазы с последующим присоединением к одному из генов домена PLAT произошла относительно недавно. Домены в обеих архитектурах очень похожи. Тем не менее, есть 4 "выброса" у Лучеперых рыб, таким образом данное суждение не охватывает всего многообразия их видов. То же касается и остальных подтаксонов. Из-за большого количества таких "выбросов" сложно с уверенностью говорить о том, что возникнование двудоменной архитетуры было независимым у разных классов. Таким образом, я склоняюсь к мысли, что обе архитектуры у предка присутствовали (получившись в результате дупликации), и их эволюция в классах независима. Но доменная архитектура довольно лабильна, и возможно, были повторные дупликации, приведшие к созданию довольно простой архитектуры Lipase+PLAT вторично в образовавшихся классах (Actinopterigii и Mammalia). Тем более, что PLAT, судя по литературным данным, очень часто встречается вместе с белками, функция которых сопряжена с липидами.

© Elizaveta Besedina, FBB 2012
lizaveta@kodomo.fbb.msu.ru