Учебный сайт Аксеновой Марины

Укоренение в среднюю точку

В данном задании требовалось укоренить в среднюю точку дерево, построенное методом Neighbor-Joining using % identity при выполнении одного из заданий предыдущего практикума. Данное дерево было реконструировано по белкам семейства пептидил-тРНК гидролаз в программе JalView.
Для этого сначала при помощи Uniprot были получены нужные последовательности, которые затем были выровнены сервисом Muscle (ссылка на fasta-файл с выравниванием).
Далее полученное выравнивание было открыто в JalView (ссылка на проект в формате .jvp), где и было сконструровано нужное дерево.

Рис 1. Изображение дерева, построенного программой JalView методом Neighbor-Joining using % identity.

Данное дерево получилось неразрешенным и отличающимся от правильного. Для доказательства того, что деревья отличаются, можно сравнить их скобочные формулы, а в данном случае хватит и сравнения их частей.
Часть скобочной формулы реконструированного дерева: (((BACAN, GEOKA), STAAR), CLOTE), FINM2)
Скобочная формула правильного дерева: ((CLOTE, FINM2), ((LACAC, (ENTFA, STRPN)), (STAAR, (BACAN, GEOKA))));
Видно, что в реконструированном дереве нет ветви, отделяющей бактерии CLOTE, FINM2 от остальных.

К сожалению, программа MEGA по не совсем понятным причинам отказывается переукоренять деревья, построенные JalView. Поэтому для выполнения задания была использована программа retree пакета PHYLIP. Для того, чтобы укоренить дерево в этой программе, потребовалось:

  • файл с деревом в Newick-формате переименовать в файл с именем intree;
  • скопировать в рабочую директорию и запустить там файл retree.exe;
  • подтвердить правильность настроек программы (нажать Y), а затем выбрать команду "Midpoint root the tree" (нажать M);
  • сохранить скобочную формулу полученного дерева в файл с именем outtree.

Ниже для сравнения представлены изображения деревьев, полученные программой retree.exe пакета PHYLIP (после и до укоренения). Что интересно, программа retree.exe, в отличие от JalView, построила разрешенное дерево.

Рис 2. Изображения дерева, полученные при помощи программы retree.exe пакета PHYLIP
(сверху - после укоренения, снизу - до).

Также дерево было открыто в программе MEGA. Для этого скобочная формула из файла outtree была скопирована в файл tree.tre. Результат представлен на Рис. 3.

Рис 3. Изображение укорененного в среднюю точку дерева, открытое в программе MEGA.

Как видно из Рис. 2 и 3, укоренение разбило дерево на 2 ветви: {GEOKA, BACAN, STAAR, CLOTE, FINM2} vs {LACAC, STRPN, ENTFA}.
Такое разбиение на ветви не соответствует иходному дереву, построенному в первом практикуме. Кроме того, если соотнести такое разбиение с таксономией (Рис. 4), то становится ясно, что при данном укоренении класс Bacilli (бактерии, принадлежащие этому классу, отделены красными уголками) оказывается разбит на 2 части из-за бактерий CLOTE и FINM2, принадлежащих к классам Clostridia и Tissierellia соответственно. Таким образом, построенное дерево не является правильным.

Рис 4. Изображение укорененного в среднюю точку дерева, соотнесенное с таксономией.
Красными уголками отделены бактерии класса Bacilli, зеленой рамкой - бактерии CLOTE и FINM2.

Можно заметить также, что, в отличие от программы retree.exe пакета PHYLIP, MEGA построила неразрешенное дерево (ветвь {LACAC, STRPN, ENTFA} не является бинарной). Это может объясняться тем, что в скобочной формуле различия в расстояниях для (LACAC, STRPN) и ((LACAC, STRPN), ENTFA) очень незначительны, и MEGA просто не смогла разрешить это дерево. Однако, поскольку разбиение ((LACAC, STRPN), ENTFA) соответствует скобочной формуле, изображению дерева, построенному программой retree.exe и правильному дереву, то изображение в retree.exe более правильное, чем изображение в MEGA.