Главная страница > Второй семестр > Филогенетические деревья
Реконструкция филогенетических деревьев проводилась по данным эталонного выравнивания сахароизомеризующих доменов
(SIS, код доступа PF01380), взятого из базы данных Pfam (рис. 1).
Были рассмотрены фрагменты пяти последовательностей глюкозамин фруктоза-6-фосфатаминотрансферазы [изомеризующей], соответствующие
данному домену:
Приведенные выше белки являются ортологами, так как выполняют одинаковую функцию. Это позволяет рассматривать
деревья, реконструированные для фрагментов последовательностей, как филогенетические деревья организмов, которым эти
последовательности принадлежат (см. ниже).
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | 1 | 0 |   |   |   |   |   |   |   |   | 2 | 0 |   |   |   |   |   |   |   |   | 3 | 0 |   |   |   |   |   |   |   |   | 4 | 0 |   |   |   |   |   |   |   |   | 5 | 0 |   |   |   |   |   |   |   |   | 6 | 0 |   |   |   |   |   |   | ||
  |   | G | F | A | 1 | _ | S | C | H | P | O |   |   | 3 | 7 | 7 |   | : |   | I | I | R | K | S | R | R | L | I | F | V | A | C | G | T | S | Y | H | S | C | V | A | V | R | P | L | F | E | E | L | T | N | I | P | V | V | V | E | L | A | S | D | F | V | D | R | C | P | S | V | F | R | D | D | T | F | I | F | V | S |   | : |   | 4 | 3 | 6 | ||
  |   | G | L | M | S | _ | H | A | E | I | N |   |   | 2 | 8 | 8 |   | : |   | I | L | E | K | V | E | H | I | Q | I | V | A | C | G | T | S | Y | N | A | G | M | V | A | R | Y | W | F | E | S | L | A | G | V | S | C | D | V | E | I | A | S | E | F | R | Y | R | K | F | V | T | R | P | N | S | L | L | I | T | L | S |   | : |   | 3 | 4 | 7 | ||
  |   | G | L | M | S | _ | E | C | O | L | I |   |   | 2 | 8 | 8 |   | : |   | L | L | S | K | V | E | H | I | Q | I | L | A | C | G | T | S | Y | N | S | G | M | V | S | R | Y | W | F | E | S | L | A | G | I | P | C | D | V | E | I | A | S | E | F | R | Y | R | K | S | A | V | R | R | N | S | L | M | I | T | L | S |   | : |   | 3 | 4 | 7 | ||
  |   | G | F | A | 1 | _ | C | A | N | A | L |   |   | 3 | 9 | 1 |   | : |   | T | I | R | R | C | R | R | I | I | M | I | A | C | G | T | S | Y | H | S | C | L | A | T | R | S | I | F | E | E | L | T | E | I | P | V | S | V | E | L | A | S | D | F | L | D | R | R | S | P | V | F | R | D | D | T | C | V | F | V | S |   | : |   | 4 | 5 | 0 | ||
  |   | G | L | M | S | _ | B | A | C | S | U |   |   | 2 | 8 | 5 |   | : |   | A | V | A | E | A | D | R | I | Y | I | I | G | C | G | T | S | Y | H | A | G | L | V | G | K | Q | Y | I | E | M | W | A | N | V | P | V | E | V | H | V | A | S | E | F | S | Y | N | M | P | L | L | S | K | K | P | L | F | I | F | L | S |   | : |   | 3 | 4 | 4 | ||
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | |||
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | |||
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | 7 | 0 |   |   |   |   |   |   |   |   | 8 | 0 |   |   |   |   |   |   |   |   | 9 | 0 |   |   |   |   |   |   |   | 1 | 0 | 0 |   |   |   |   |   |   |   | 1 | 1 | 0 |   |   |   |   |   |   |   | 1 | 2 | 0 |   |   |   |   |   |   | ||
  |   | G | F | A | 1 | _ | S | C | H | P | O |   |   | 4 | 3 | 7 |   | : |   | Q | S | G | E | T | A | D | S | L | L | A | L | Q | Y | T | L | E | N | G | A | L | - | A | I | G | V | V | N | C | V | G | S | S | I | S | R | K | T | H | C | G | V | H | I | N | A | G | P | E | I | C | V | A | S | T | K | A | Y | T | S |   | : |   | 4 | 9 | 5 | ||
  |   | G | L | M | S | _ | H | A | E | I | N |   |   | 3 | 4 | 8 |   | : |   | Q | S | G | E | T | A | D | T | L | A | A | L | R | L | A | K | E | K | G | Y | M | A | A | L | T | I | C | N | V | A | G | S | S | L | V | R | E | S | D | L | A | F | M | T | R | A | G | V | E | V | G | V | A | S | T | K | A | F | T | T |   | : |   | 4 | 0 | 7 | ||
  |   | G | L | M | S | _ | E | C | O | L | I |   |   | 3 | 4 | 8 |   | : |   | Q | S | G | E | T | A | D | T | L | A | G | L | R | L | S | K | E | L | G | Y | L | G | S | L | A | I | C | N | V | P | G | S | S | L | V | R | E | S | D | L | A | L | M | T | N | A | G | T | E | I | G | V | A | S | T | K | A | F | T | T |   | : |   | 4 | 0 | 7 | ||
  |   | G | F | A | 1 | _ | C | A | N | A | L |   |   | 4 | 5 | 1 |   | : |   | Q | S | G | E | T | A | D | S | I | L | A | L | Q | Y | C | L | E | R | G | A | L | - | T | V | G | I | V | N | S | V | G | S | S | M | S | R | Q | T | H | C | G | V | H | I | N | A | G | P | E | I | G | V | A | S | T | K | A | Y | T | S |   | : |   | 5 | 0 | 9 | ||
  |   | G | L | M | S | _ | B | A | C | S | U |   |   | 3 | 4 | 5 |   | : |   | Q | S | G | E | T | A | D | S | R | A | V | L | V | Q | V | K | A | L | G | H | K | - | A | L | T | I | T | N | V | P | G | S | T | L | S | R | E | A | D | Y | T | L | L | L | H | A | G | P | E | I | A | V | A | S | T | K | A | Y | T | A |   | : |   | 4 | 0 | 3 | ||
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | |||
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | |||||||||||||||||||||||||||||||||||||||||||||||||
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | 1 | 3 | 0 |   |   |   |   |   |   |   |   |   |   | ||||||||||||||||||||||||||||||||||||||||||||||||
  |   | G | F | A | 1 | _ | S | C | H | P | O |   |   | 4 | 9 | 6 |   | : |   | Q | Y | V | A | L | V | L | M | A | L | Y | L | S | R |   | : |   | 5 | 0 | 9 | ||||||||||||||||||||||||||||||||||||||||||||||||
  |   | G | L | M | S | _ | H | A | E | I | N |   |   | 4 | 0 | 8 |   | : |   | Q | L | A | A | L | L | M | L | V | T | A | L | G | K |   | : |   | 4 | 2 | 1 | ||||||||||||||||||||||||||||||||||||||||||||||||
  |   | G | L | M | S | _ | E | C | O | L | I |   |   | 4 | 0 | 8 |   | : |   | Q | L | T | V | L | L | M | L | V | A | K | L | S | R |   | : |   | 4 | 2 | 1 | ||||||||||||||||||||||||||||||||||||||||||||||||
  |   | G | F | A | 1 | _ | C | A | N | A | L |   |   | 5 | 1 | 0 |   | : |   | Q | Y | I | A | L | V | M | F | A | L | S | L | S | N |   | : |   | 5 | 2 | 3 | ||||||||||||||||||||||||||||||||||||||||||||||||
  |   | G | L | M | S | _ | B | A | C | S | U |   |   | 4 | 0 | 4 |   | : |   | Q | I | A | V | L | A | V | L | A | S | V | A | A | D |   | : |   | 4 | 1 | 7 | ||||||||||||||||||||||||||||||||||||||||||||||||
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
Рис. 1. Эталонное выравнивание фрагментов последовательностей GFA1_SCHPO, GLMS_HAEIN, GLMS_ECOLI, GFA1_CANAL и GLMS_BACSU, соответствующих сахароизомеризующему домену.
Построение дерева проводилось по данным матрицы попарных совпадений последовательностей эталонного выравнивания.
На основании этой матрицы была создана матрица эволюционных расстояний, элементы которой Di, j вычислялись по формуле:
Di, j = 1 - Pi, j,
где Pi, j элемент матрицы попарных совпадений
(см. книгу UPGMA.xls, лист distances).
При построении дерева использовался алгоритм UPGMA. Каждая итерация алгоритма включает следующие шаги:
Описанный выше алгоритм реализован с помощью электронной таблицы Excel
(см. книгу UPGMA.xls, лист UPGMA). Правильная скобочная структура полученного дерева:
ρXY = 0.5 Dx, y ,
Lx = ρXY - ρX ,
Lx = ρXY - ρY ,
где ρX высота кластера X, ρY высота кластера Y.
Рис. 2 (А, Б). Визуализация деревьев, построенных по алгоритму UPGMA для фрагментов последовательостей GFA1_SCHPO, GLMS_HAEIN, GLMS_ECOLI, GFA1_CANAL и GLMS_BACSU, соответствующих сахароизомеризующему домену. Синими цифрами показаны длины ветвей. А. Неукорененное дерево, полученное с помощью программы drawtree. Б. Укорененное дерево, полученное с помощью программы drawgram.
Построение дерева по методу ближайших соседей (neighbor-joining) было проведено с помощью программы ClustalW. В качестве
исходных данных использовались
аминокислотные последовательности сахароизомеризующих доменов. Правильная скобочная
структура полученного дерева приведена ниже:
Рис. 3 (А, Б). Визуализация деревьев, построенных по методу ближайших соседей для фрагментов последовательостей GFA1_SCHPO, GLMS_HAEIN, GLMS_ECOLI, GFA1_CANAL и GLMS_BACSU, соответствующих сахароизомеризующему домену. Синими цифрами показаны длины ветвей. А. Неукорененное дерево, полученное с помощью программы drawtree. Б. Укорененное дерево, полученное с помощью программы drawgram.
© Куравский Михаил Львович, 2006