1. Таксономия
Выборка из прошлого задания:
Bacillus anthracis | BACAN | |
Clostridium botulinum | CLOB1 | |
Enterococcus faecalis | ENTFA | |
Geobacillus kaustophilus | GEOKA | |
Lactobacillus delbrueckii | LACDA | |
Listeria monocytogenes | LISMO | |
Staphylococcus epidermidis | STAES | |
Streptococcus pneumoniae | STRPN |
Все организмы из выборки относятся к Bacteria; Firmicutes. Дерево, построенное на прошлом занятии, правильно отражает филогению. Выделены цветом ветви, которые выделяют истинные таксономические категории, содержащие здесь больше одного представителя (каждый из организмов, кроме BACAN и GEOKA, принадлежит к отдельному семейству, которые здесь не показаны).
2. Выравнивание
Был выбран белок RF1 — фактор высвобождения пептидной цепи 1. Восемь последовательностей: seq.fasta. Выравнивание с помощью muscle: seq_aligned.fasta; проект JalView: seq_aligned.jar.
3. Диагностические позиции
Только несколько позиций позволяют разрешить все три рассматриваемые группы (Bacillales; Lactobacillales; Clostridia): строго — 35 (RRRR, MMM, Q) и 41 (QQQQ, EEE, H).
Если подойти к делу формально и не ограничиваться точным совпадением аминокислот в каждом таксоне, разделить эти группы также можно по позициям: 10 (AAAI, VSS, F); 19 (NNNN, GGQ, S); 31 (SPPA, TTT, Q); 34 (LLLL, FFY, W); 56 (DSNT, QQA, K); 73 (KKKT, GNG, E); 156 (YPPE, MVQ, A); 192 (EEEE, VSV, D); 196 (GGGG, QQA, S).
Есть также очень много позиций, позволяющих надежно отличить Clostridia от Bacilli, где у всех Bacilli одинаковый остаток, а у Clostridia — отличающийся: 14 (R/K); 20 (E/N); 30 (D/N); 82 (K/Q); 100 (K/T); 115 (I/F); 121 (A/G); 132 (G/S); 133 (D/N); 146 (G/N); 184 (A/V); 319 (V/I).
Также интересной является позиция выравнивания 241, которая позволяет выделить Lactobacillales (TTTT, KKK, T).
4. Четыре дерева
Файлы: dist_ident.tre; dist_blosum.tre;
neighbour_ident.tre; neighbour_blosum.tre.
Изображения (в том же порядке):
Из соображений человеколюбия (чтобы читателю не приходилось прыгать в верх страницы для сравнения) повторяем правильное дерево:
Для начала, деревья с оценкой расстояния по проценту идентичности и по BLOSUM62 идентичны (в neighbour/ident лишь из-за очень небольшого расстояния между LACDA и STAES программа объединила их в общую ветвь). В действительности же можно ориентироваться только на какие-нибудь два дерева, например, которые выстроены по BLOSUM (два справа).
Разделение Clostridia / Bacilli показано верно; эта ветвь везде совпадает. Ветвь, ведущая к
UPD. Комментарии в терминах ветвей: лишние ветви — те, которые есть в дереве JalView, но которых нет в правильном; потерянные — те, которые не присутствуют в дереве JalView, хотя есть в правильном.
Для верхнего дерева (dist_blosum): лишние ветви —
(CLOB1,LACDA,STAES) vs. (ENTFA,STRPN,LISMO,GEOKA,BACAN);
(CLOB1,LACDA) vs. (STAES,ENTFA,STRPN,LISMO,GEOKA,BACAN);
потерянные ветви —
(BACAN,GEOKA,LISMO,STAES) vs. (STRPN,ENTFA,LACDA,CLOB1);
(STRPN,ENTFA,LACDA) vs. (CLOB1,BACAN,GEOKA,LISMO,STAES).
Для нижнего дерева (neighbour_blosum): лишние ветви —
(CLOB1,LACDA,STAES) vs. (ENTFA,STRPN,LISMO,GEOKA,BACAN);
(CLOB1,STAES) vs. (LACDA,ENTFA,STRPN,LISMO,GEOKA,BACAN);
потерянные ветви —
(BACAN,GEOKA,LISMO,STAES) vs. (STRPN,ENTFA,LACDA,CLOB1);
(STRPN,ENTFA,LACDA) vs. (CLOB1,BACAN,GEOKA,LISMO,STAES).
5. MEGA-дерево
Дерево, построенное с помощью MEGA (mega_tree.tre), оказывается не лучше, чем те, что состряпал JalView:
Все-таки, Clostridia и Bacilli разделены, группа Lactobacillales худо-бедно обособлена (но в другой подтопологии), однако провалом в этом всём является тот факт, что Lactobacillales при таком раскладе входит в одинаковую по рангу группу Bacillales.
UPD. Комментарии в терминах ветвей.
Лишние ветви:
(STRPN,LACDA) vs. (ENTFA,LISMO,BACAN,GEOKA,STAES,CLOB1);
(STRPN,LACDA,ENTFA,LISMO) vs. (BACAN,GEOKA,STAES,CLOB1);
(CLOB1,STAES) vs. (STRPN,LACDA,ENTFA,LISMO,BACAN,GEOKA).
Потерянные ветви:
(BACAN,GEOKA,LISMO) vs. (STAES,STRPN,ENTFA,LACDA,CLOB1);
(BACAN,GEOKA,LISMO,STAES) vs. (STRPN,ENTFA,LACDA,CLOB1);
(STRPN,ENTFA) vs. (BACAN,GEOKA,LISMO,STAES,LACDA,CLOB1).
Из всего этого можно сделать вывод: не стоит строить филогению по одному-единственному белку.
6. TreeTop
Сервис возвратил вот такую картинку:
С этим деревом такие же проблемы, что с остальными: LACDA и STAES норовят вылезти в отдельные группы и никак не хотят уживаться в своих родных Lactobacillales и Bacillales. Очевидно, проблема кроется не столько в программах, сколько в эволюции самого белка.
Сам сервис довольно удобный, позволяет настраивать множество параметров (особенно если использовать полную форму), генерирует текстовые и графические представления.