Карань Анна
студентка факультета биоинженерии и бионформатики

Задание 8*

В этом задании необходимо сравнить результаты работы алгоритма Neighbor-joining при разных способах построения матрицы расстояний. JalView пользуется тремя "примитивными" методами (подсчёт весов сопоставлений или даже просто подсчёт процента совпадающих букв). MEGA использует более совершенный способ оценки расстояний, основанный на приниципе максимального правдоподобия. Нужно сравнить полученные деревья, выбрать наиболее похожий на реальной дерево (представленное на основной странице практикума).

Таблица 1.Деревья, построенные в Jalview, различными методами Neighbor-joining
Название метода построенияПолученное дерево
Neighbor-joining using PAM 250
Neighbor-joining using BLOSUM62
Neighbor-joining using % Identity

Рис.1 Дерево, построенное в Mega методом Neighbor-joining на основе того же выравнивания, что и деревья в Jalview

Для Neighbor-joining using PAM 250 и BLOSUM62 просто используются различные матрицы расстояний (http://www.jalview.org/help/html/calculations/scorematrices.html), а Neighbor-joining using % Identity использует для построения дерева только процент одинаковых букв.
Как видно в Таблице 1 и Рис.1 деревья, хоть и не сильно, но отличаются, поэтому необходимо сравнить их с реальным (Рис.2)

Рис.2 Реальное дерево

На всех построенных деревьях LACAC оказался на отдельной ветви далеко ото всех, CLOBA и CLOTE почти на всех деревьях отделились (кроме дерева Neighbor-joining using % Identity, где слишком маленькое расстояние, это можно объяснить очевидно плохой разделительной способностью метода, так как учитывается только процент сходство, а не его значимость). Так же на всех деревьях STRPN и STAES оказались ближке к друг другу, чем на реальном дереве.
Если выбирать дерево, ближе всех остальных к реальности, то оказывается, что это деревья, построенные методами Neighbor-joining using PAM 250 и BLOSUM62, а не Mega (так как на них FINM2 ближе к CLOBA и CLOTE, чем на дереве Mega).
Конечно, на основе этих результатов ни в коем случае нельзя отбрасывать и принижать способ построения деревьев в Mega. Такой провал можно объяснить небольшим размером последовательности или плохим выбором белка, ведь это не белок не выполняет функцию, требующую очень консервативной последовательности, а различий в последовательности при одинаковой структуре могут составлять даже больше 30%.
Правильные деревья строятся на основе огромного количества белков, и не только их, поэтому такой результат не опровергает, но и не подтверждает преимущества Mega, можно только сказать, что Neighbor-joining using PAM 250 и BLOSUM62 тоже не так плохи, и могут в некоторых случаях построить дерево лучше, чем Mega.


©Карань Анна, 2015