Отчет по практикуму №4: Реконструкция филогении ClpX и его гомологов
Ход исследования
В рамках работы было исследовано эволюционное родство белка CLPX_ECOLI. Были выполнены следующие этапы:
- Из общего файла протеомов были выбраны 8 бактерий ECOLI, YERPE, PSEAE, BURMA, BORPE, NEIMA, RHIME, AGRFC.
- С помощью программы
blastpбыли найдены гомологи с порогом E-value < 0.0001. - Множественное выравнивание последовательностей построено алгоритмом
MAFFT. - Филогенетическое дерево реконструировано методом максимального правдоподобия в
IQ-TREEи укоренено в среднюю точку.
1. Результаты BLAST-поиска
blast_resНиже приведена часть выдачи результата поиска гомологов программой BLAST (формат outfmt 6). Заданный порог E-value позволил выявить как близкие ортологи, так и паралогичные семейства АТФаз.
sp|P0A6H1.2|CLPX_ECOLI sp|P0A6H1|CLPX_ECOLI 100.000 424 0 0 1 424 1 424 0.0 860
sp|P0A6H1.2|CLPX_ECOLI sp|Q8ZC66|CLPX_YERPE 92.689 424 30 1 1 424 1 423 0.0 805
sp|P0A6H1.2|CLPX_ECOLI sp|Q9I2U0|CLPX_PSEAE 77.033 418 94 2 1 417 1 417 0.0 654
sp|P0A6H1.2|CLPX_ECOLI sp|Q62JK8|CLPX_BURMA 73.494 415 106 3 1 413 1 413 0.0 617
sp|P0A6H1.2|CLPX_ECOLI sp|Q7VXI6|CLPX_BORPE 71.059 425 119 4 1 424 1 422 0.0 613
sp|P0A6H1.2|CLPX_ECOLI sp|Q8UFY5|CLPX_AGRFC 70.531 414 119 3 9 422 12 422 0.0 596
sp|P0A6H1.2|CLPX_ECOLI sp|Q92QQ2|CLPX_RHIME 71.499 407 113 3 9 415 12 415 0.0 596
sp|P0A6H1.2|CLPX_ECOLI sp|Q9JTX8|CLPX_NEIMA 69.212 406 117 2 15 413 8 412 0.0 557
sp|P0A6H1.2|CLPX_ECOLI sp|Q9HUC5|HSLU_PSEAE 36.686 169 86 4 66 234 4 151 1.66e-21 95.9
sp|P0A6H1.2|CLPX_ECOLI sp|Q9HUC5|HSLU_PSEAE 30.672 238 103 7 177 406 249 432 3.24e-17 82.8
sp|P0A6H1.2|CLPX_ECOLI sp|Q8ZJJ5|HSLU_YERPE 45.000 100 54 1 66 165 5 103 2.51e-21 95.1
sp|P0A6H1.2|CLPX_ECOLI sp|Q8ZJJ5|HSLU_YERPE 34.419 215 82 6 177 386 249 409 1.59e-20 92.8
sp|P0A6H1.2|CLPX_ECOLI sp|P0A6H5|HSLU_ECOLI 45.000 100 54 1 66 165 5 103 8.42e-21 93.6
sp|P0A6H1.2|CLPX_ECOLI sp|P0A6H5|HSLU_ECOLI 33.488 215 84 6 177 386 249 409 2.10e-19 89.7
sp|P0A6H1.2|CLPX_ECOLI sp|Q7VUJ9|HSLU_BORPE 42.857 112 60 2 66 177 7 114 8.80e-21 93.6
sp|P0A6H1.2|CLPX_ECOLI sp|Q7VUJ9|HSLU_BORPE 32.340 235 99 7 177 406 250 429 6.11e-19 88.2
sp|P0A6H1.2|CLPX_ECOLI sp|Q92TA7|HSLU_RHIME 45.098 102 55 1 66 167 5 105 1.56e-20 92.8
sp|P0A6H1.2|CLPX_ECOLI sp|Q92TA7|HSLU_RHIME 33.023 215 85 6 179 388 243 403 1.06e-19 90.5
sp|P0A6H1.2|CLPX_ECOLI sp|Q8UJ87|HSLU_AGRFC 46.078 102 54 1 66 167 5 105 2.76e-20 92.0
sp|P0A6H1.2|CLPX_ECOLI sp|Q8UJ87|HSLU_AGRFC 30.698 215 90 5 179 388 243 403 4.24e-18 85.5
sp|P0A6H1.2|CLPX_ECOLI sp|Q62F00|HSLU_BURMA 47.059 102 53 1 66 167 5 105 5.45e-17 82.4
sp|P0A6H1.2|CLPX_ECOLI sp|Q62F00|HSLU_BURMA 31.330 233 101 7 177 404 252 430 1.43e-14 74.7
sp|P0A6H1.2|CLPX_ECOLI sp|P0AAI3|FTSH_ECOLI 34.615 78 45 2 115 192 188 259 2.32e-05 46.2
sp|P0A6H1.2|CLPX_ECOLI tr|A0A5P8YB42|A0A5P8YB42_YERPE 25.000 188 93 7 28 192 148 310 2.56e-05 46.2
sp|P0A6H1.2|CLPX_ECOLI tr|A0A5P8YCE6|A0A5P8YCE6_YERPE 34.615 78 45 2 115 192 188 259 3.02e-05 45.8
sp|P0A6H1.2|CLPX_ECOLI tr|Q92M98|Q92M98_RHIME 35.065 77 44 2 115 191 194 264 4.39e-05 45.4
sp|P0A6H1.2|CLPX_ECOLI tr|Q7CT50|Q7CT50_AGRFC 35.065 77 44 2 115 191 194 264 5.00e-05 45.4
2. Филогения исследуемых бактерий
Для корректного сопоставления результатов исходное дерево бактерий было перерисовано в iTOL для 8 исследуемых видов.
Рис 1. Филогенетическое дерево 8 исследуемых видов бактерий
Примеры ортологов
CLPX_ECOLI/CLPX_YERPEHSLU_PSEAE/HSLU_ECOLIFTSH_RHIME/FTSH_AGRFC
Примеры паралогов
CLPX_ECOLI/HSLU_ECOLICLPX_YERPE/A0A5P8YCE6_YERPE(FtsH)CLPX_AGRFC/HSLU_AGRFC
3. Визуализация реконструированных деревьев гомологов
Рис 2. Реконструированное дерево гомологов (укоренение в среднюю точку). Цветовая разметка обозначает крупные ортологические группы: красный — семейство ClpX (8 последовательностей), синий — семейство HslU (7 последовательностей), зеленый — семейство FtsH (6 последовательностей). Дальние эволюционные паралоги оставлены без заливки (черные ветви) ввиду нево.
Рис 3. Дерево со схлопнутыми группами. Ветви стабильных ортологических групп свернуты в треугольники для упрощения.
Обсуждение топологии
Реконструированное дерево гомологов (Рис. 2, 3) было детально сопоставлено с таксономическим деревом (Рис. 1):
- Группа CLPX (Красная клада, 8 последовательностей):
Филогения внутри этой группы соответствует эталонному дереву видов. Все 8 организмов присутствуют, а порядок ветвления строго воспроизводит таксономическое расхождение классов: четко обособлены Альфа- (
RHIME+AGRFC), Бета- (BURMA+BORPE+NEIMA) и Гаммапротеобактерии (PSEAEв качестве внешней группы к пареECOLI+YERPE). Ген эволюционировал строго вертикально. - Группа HSLU (Синяя клада, 7 последовательностей):
Внутригрупповая топология оставшихся видов соответствует эталонному дереву. Единственное отличие от дерева видов - отсутствие белка бактерии
NEIMA. - Группа FTSH (Зеленая клада, 6 последовательностей):
В этой группе наблюдаются как отсутствие некоторых таксонов, так и явная ошибка реконструкции топологии. Во-первых, в кладе полностью отсутствуют белки
NEIMAиBORPE. Во-вторых, обнаружено несоответствие топологии у организмаPSEAE: по таксономии этот вид должен объединяться с паройECOLI+YERPE. Однако на дереве гомологовPSEAEневерно объединилась с кладойBURMA,AGRFCиRHIME. - Группа ClpA/ClpB (Оранжевая клада, 7 последовательностей):
Эта группа включает 5 видов и демонстрирует полное совпадение в сравнении с видовым (Рис. 1). отсутствуют:
BORPE. - Прочие находки (Черные ветви): Остальные последовательности в неокрашенной части дерева. Как функциональное (разные типы белков), так и недостаточность для сравнения (менее 3). Предположительно ошибки бласта(или низкий порог фильтрации находок).