Учебный сайт Кирилла Цуканова → Четвертый семестр

Реконструкция филогенетических деревьев

1. Таксономия

Выборка из прошлого задания:

Bacillus anthracisBACAN
Clostridium botulinumCLOB1
Enterococcus faecalisENTFA
Geobacillus kaustophilusGEOKA
Lactobacillus delbrueckiiLACDA
Listeria monocytogenesLISMO
Staphylococcus epidermidisSTAES
Streptococcus pneumoniaeSTRPN

Все организмы из выборки относятся к Bacteria; Firmicutes. Дерево, построенное на прошлом занятии, правильно отражает филогению. Выделены цветом ветви, которые выделяют истинные таксономические категории, содержащие здесь больше одного представителя (каждый из организмов, кроме BACAN и GEOKA, принадлежит к отдельному семейству, которые здесь не показаны).

2. Выравнивание

Был выбран белок RF1 — фактор высвобождения пептидной цепи 1. Восемь последовательностей: seq.fasta. Выравнивание с помощью muscle: seq_aligned.fasta; проект JalView: seq_aligned.jar.

3. Диагностические позиции

Только несколько позиций позволяют разрешить все три рассматриваемые группы (Bacillales; Lactobacillales; Clostridia): строго — 35 (RRRR, MMM, Q) и 41 (QQQQ, EEE, H).

Если подойти к делу формально и не ограничиваться точным совпадением аминокислот в каждом таксоне, разделить эти группы также можно по позициям: 10 (AAAI, VSS, F); 19 (NNNN, GGQ, S); 31 (SPPA, TTT, Q); 34 (LLLL, FFY, W); 56 (DSNT, QQA, K); 73 (KKKT, GNG, E); 156 (YPPE, MVQ, A); 192 (EEEE, VSV, D); 196 (GGGG, QQA, S).

Есть также очень много позиций, позволяющих надежно отличить Clostridia от Bacilli, где у всех Bacilli одинаковый остаток, а у Clostridia — отличающийся: 14 (R/K); 20 (E/N); 30 (D/N); 82 (K/Q); 100 (K/T); 115 (I/F); 121 (A/G); 132 (G/S); 133 (D/N); 146 (G/N); 184 (A/V); 319 (V/I).

Также интересной является позиция выравнивания 241, которая позволяет выделить Lactobacillales (TTTT, KKK, T).

4. Четыре дерева

Файлы: dist_ident.tre; dist_blosum.tre;
neighbour_ident.tre; neighbour_blosum.tre.

Изображения (в том же порядке):

Из соображений человеколюбия (чтобы читателю не приходилось прыгать в верх страницы для сравнения) повторяем правильное дерево:

Для начала, деревья с оценкой расстояния по проценту идентичности и по BLOSUM62 идентичны (в neighbour/ident лишь из-за очень небольшого расстояния между LACDA и STAES программа объединила их в общую ветвь). В действительности же можно ориентироваться только на какие-нибудь два дерева, например, которые выстроены по BLOSUM (два справа).

Разделение Clostridia / Bacilli показано верно; эта ветвь везде совпадает. Ветвь, ведущая к GEOKA+BACAN / LISMO, также везде показана верно, как и ветвь, ведущая к STRPN+ENTFA. Однако в обоих рассматриваемых деревьях, построенных JalView, LACDA и STAES вынесены из своих ветвей (соответственно Lactobacillales и Bacillales) и представлены в отдельных, более старших рангах, где они объединяются с упомянутыми двумя ветвями каждый по отдельности. Соответственно, как таковые верные ветви Bacillales и Lactobacillales отсутствуют и присутствуют несколько совершенно новых и несколько неполных.

UPD. Комментарии в терминах ветвей: лишние ветви — те, которые есть в дереве JalView, но которых нет в правильном; потерянные — те, которые не присутствуют в дереве JalView, хотя есть в правильном.

Для верхнего дерева (dist_blosum): лишние ветви —
(CLOB1,LACDA,STAES) vs. (ENTFA,STRPN,LISMO,GEOKA,BACAN);
(CLOB1,LACDA) vs. (STAES,ENTFA,STRPN,LISMO,GEOKA,BACAN);
потерянные ветви —
(BACAN,GEOKA,LISMO,STAES) vs. (STRPN,ENTFA,LACDA,CLOB1);
(STRPN,ENTFA,LACDA) vs. (CLOB1,BACAN,GEOKA,LISMO,STAES).

Для нижнего дерева (neighbour_blosum): лишние ветви —
(CLOB1,LACDA,STAES) vs. (ENTFA,STRPN,LISMO,GEOKA,BACAN);
(CLOB1,STAES) vs. (LACDA,ENTFA,STRPN,LISMO,GEOKA,BACAN);
потерянные ветви —
(BACAN,GEOKA,LISMO,STAES) vs. (STRPN,ENTFA,LACDA,CLOB1);
(STRPN,ENTFA,LACDA) vs. (CLOB1,BACAN,GEOKA,LISMO,STAES).

5. MEGA-дерево

Дерево, построенное с помощью MEGA (mega_tree.tre), оказывается не лучше, чем те, что состряпал JalView:

Все-таки, Clostridia и Bacilli разделены, группа Lactobacillales худо-бедно обособлена (но в другой подтопологии), однако провалом в этом всём является тот факт, что Lactobacillales при таком раскладе входит в одинаковую по рангу группу Bacillales.

UPD. Комментарии в терминах ветвей.

Лишние ветви:
(STRPN,LACDA) vs. (ENTFA,LISMO,BACAN,GEOKA,STAES,CLOB1);
(STRPN,LACDA,ENTFA,LISMO) vs. (BACAN,GEOKA,STAES,CLOB1);
(CLOB1,STAES) vs. (STRPN,LACDA,ENTFA,LISMO,BACAN,GEOKA).

Потерянные ветви:
(BACAN,GEOKA,LISMO) vs. (STAES,STRPN,ENTFA,LACDA,CLOB1);
(BACAN,GEOKA,LISMO,STAES) vs. (STRPN,ENTFA,LACDA,CLOB1);
(STRPN,ENTFA) vs. (BACAN,GEOKA,LISMO,STAES,LACDA,CLOB1).

Из всего этого можно сделать вывод: не стоит строить филогению по одному-единственному белку.

6. TreeTop

Сервис возвратил вот такую картинку:

С этим деревом такие же проблемы, что с остальными: LACDA и STAES норовят вылезти в отдельные группы и никак не хотят уживаться в своих родных Lactobacillales и Bacillales. Очевидно, проблема кроется не столько в программах, сколько в эволюции самого белка.

Сам сервис довольно удобный, позволяет настраивать множество параметров (особенно если использовать полную форму), генерирует текстовые и графические представления.