Реконструкция эволюции доменной архитектуры.
1. Выбор архитектуры.
Мною было выбрано семейство EF-hand_7(АС: PF13405), включающее 321 архитектуру, 4007 последовательностей, 760 видов и 94 структуры.
Наличие данного домена обычно указывает на способность белка связывать ионы кальция и работать к кальциевый сенсор.
Мною были выбраны следующие архитектуры(рис.1), критерием было наличие как минимум 20 последовательностей с данной архитектурой.
Рисунок 1. Архитектура 1 - далее WHEAT. В данную архитектуру входит также домен EF-Hand 7 .
Рисунок 2. Архитектура 2 - далее ASTMX. Данная архитектура содержит два домена EF-Hand 7 и 1 домен EF-Hand 1 : .
С помощью данного в задании скрипта и команды python swisspfam-to-xls.py -i swisspfam.gz -z -p PF13405 -o -out.xls получила таблицу.
Далее сделала сводную таблицу, строки - исходный столбец АС, столбцы - домены pfam.
C помощью скрипта и команды python uniprot-to-taxonomy.py -i uniprot-yourlist.txt -o -taxonimy.xls
определила таксономию. yourlist был получен с помощью retrieve uniprot.
Была найдена таксономия для ac двух архитектур. В качестве таксона выбран Eukaryota, подтаксон Viridiplantae(V) и Metazoa(M).
Сделано выравнивание для белков каждой архитектуры, c помощью скрипта и команды
python filter-alignment.py -i align.mfa -m seq_ac.txt -o new_align.mfa - a "_" получено новое выравнивание.
Рисунок 3. Выравнивание для архитектур. 1 - архитектура 1, 2 - архитектура 2, M - Metazoa, V - Viridiplantae.
Построение эволюционного дерева.
Рисунок 5. Филогенетическое дерево для архитектуры 1. 1 - архитектура 1, 2 - архитектура 2, M - Metazoa, V - Viridiplantae.
В программе мега было построено дерево для данного выравнивания методом максимального сходства. Красным выделены белки архитектуры 1, черным - архитектуры 2.
Можно заметить, что архитектуры и домены разделяются не полностью, возможно, из-за того, что архитектуры отличаются не так сильно архитектура
1 - EF-Hand 7 и EF-Hand 6, архитектура 2 - два домена EF-Hand 7 и 1 EF-Hand 1. Eше одно из объяснений - широкая вариабельность данного домена,
обеспечивающая чувствительность к разным концентрациям кальция.
Однако, по выравниванию видно, что группа с однодоменнной архитектурой более консервативная.
Скобочная формула: (((((((((1V_A0A251P580/1-147:0.05293114,1V_A0A1Q3CRT8/1-120:0.02519027):0.03083558,1V_M4DTB3_BRARP/1-148:0.10445618):
0.00593799,1V_A0A1U7Y655/1-147:0.08854705):0.48233135,1M_A0A2C9LKN0/1-145:0.69885573):0.29774681,(1M_A0A1V9XXP9/1-178:0.49312460,1M_M4AVV0/1-173:0.21243470
):0.87163142):0.16652984,2V_A0A061DPJ5/1-198:0.32970650):0.02729735,(1M_A0A2C6KUK1/1-207:0.28216216,1M_A0A2A9MEI5/1-134:0.07791119):0.87593061):0.04664934,
(2M_A0A087YJZ2/1-271:1.44740414,2M_A0A0F8C7G9/1-434:0.73312883):0.49075825):0.12261592,(1V_A0A1S3T7I1/1-214:0.80993489,(2V_A0A022R2X5/1-208:0.80521011,
((1V_M4DAG0/1-188:0.21285021,1V_A0A218XA72/1-202:0.32612432):0.26627138,(1V_A2XGB3/1-130:0.20989321,(1V_C0P3C5/1-203:0.16769733,1V_W5I0X5_WHEAT/1-238:0.17636291)
:0.08682612):0.23893328):0.63821605):0.33343801):0.23019719,((((2V_A0A072U325/1-169:0.16976260,2V_A0A078J2C7/1-161:0.13575723):0.11366611,2V_A0A0K9PNE0/1-161:0.26167616)
:0.13154704,(2V_A0A1D5WQ04/1-255:0.00078809,(2V_A0A1D5V5S2/1-255:0.03447746,2V_A0A1D5VX74/1-255:0.01984552):0.01037866):0.27502603):0.55061724,((1M_A0A232F8N3/1-191:1.18504546,2V_A0A150GSH1/1-186:1.04095371)
:0.42876462,((1M_A0A2A2KF65/1-191:0.08186053,1M_A0A261CIP3/1-195:0.07470880):1.19181000,(2M_A0A068XTH0/1-169:0.06142785,(2M_A0A091CU69/1-173:0.07719570,
(2M_A0A091HPX7/1-170:0.00000000,((2M_A0A087QH66/1-156:0.00000000,2M_A0A091NU18/1-156:0.00000000):0.00000000,(2M_A0A091MKH2/1-155:0.00000000,
(2M_A0A2G8JLL8/1-179:0.07814775,(2M_A0A016UJX7/1-206:0.24867473,2M_A0A087SZP2/1-170:0.05275779):0.03008511)
:0.06892568):0.00000000):0.00000000):0.03913977):0.10637200):0.54676073):0.38003981):0.24800063):0.23269747);
|