На главную страницу
На главную страницу второго семестра

Филогенетические деревья, реконструированные разными способами

Рассмотрено эталонное множественное выравнивание семейства доменов PF08501, полученное из БД Smart. Выбраны 5 последовательностей из разных организмов.

                                                                                                                                       
                                            *                 2 0                   *                 4 0                   *          
A R O E _ L A C L A   :   V V A N P I K H S L S P F I H N L A F D L T N E N G V Y L A W E V E - - - - - - - A E K L P A I V D   :   4 3
D H Q A _ E M E N I   :   L Y G H P L P N S L S P P L H Q T V Y N A L G L N W T Q I P L S T A T G T S F T R S P E I S T F L S   :   5 0
A R O 1 _ P N E C A   :   L F G K P I K H S Q S P N I H N L G F E I L G L P Y K Y Q L F E T D - - - - - - - - - S I S E L K E   :   4 1
Q 8 U 7 B 7 _ A G R   :   L I G A D I Q L S K S P A L H M R E G A A H G L D Y S Y E L V D V T A R - - K L P Q S S L P A L L D   :   4 8
Q 8 2 M 8 3 _ S T R   :   L I G S G I G P S L S P A L H E R E A G R Q G L R Y H Y R L I D I D R L - - G V G P E A V G G L V R   :   4 8
                                          S   S P     H                                                                                
                                                                                                                     
                                          6 0                   *                 8 0                   *            
A R O E _ L A C L A   :   N V R T - L D M Y G L N I S M P Y K T E I T P F M D E L S P A A E L I G A V N T V   :   8 3
D H Q A _ E M E N I   :   S V R S N P K F V G S S V T M P W K V A I M P H L D D L T E D A R Q A G A C N T I   :   9 1
A R O 1 _ P N E C A   :   I L H L - E E F G G A S V T I P L K T N I S I L L D E I S D H A A L I G S V N T I   :   8 1
Q 8 U 7 B 7 _ A G R   :   E L E A - R G F A G T N I T H P F K Q A V I P H L H E L S D D A R M L G A V N T V   :   8 8
Q 8 2 M 8 3 _ S T R   :   A A R D - L G F D G L N I T H P C K Q L V I S H L D T L A P Q A E A L G A V N T V   :   8 8
                                            G           P   K                           A       G     N T            

Алгоритм UPGMA

С помощью программы MsExcel получено дерево (см. файл UPGMA.xls). Для этого использован алгоритм UPGMA.
Полученная скобочная формула:
(((Q8U7B7_AGRT5:26.5, Q82M83_STRAW:26.5):34.75, (AROE_LACLA:33.0, ARO1_PNECA:33.0):34.75):36.15, DHQA_EMENI:36.15);
 
Для визуализации дерева использованы программы из Online-версии пакета Phylip: drawtree и drawgram.
Полученные деревья:
drawtree drawgram

Программа drawgram строит укорененное дерево. Корень находится между наиболее отдаленными последовательностями. Длину ветвей сложно сравниванить,то есть дерево отражает только ход эволюци (в идеале).
Программа drawtree строит неукорененное дерево. Но длина ветвей различна, и дерево показывает сходство последовательностей.

Рассмотрим организмы, содержащие данные последовательности:
Белок Организм Царство
AROE_LACLA Streptococcus lactis Bacteria
DHQA_EMENI Aspergillus nidulans Fungi
ARO1_PNECA Pneumocystis carinii Fungi
Q8U7B7_AGRT5 Agrobacterium tumefaciens Bacteria
Q82M83_STRAW Streptomyces avermitilis Bacteria

Таким образом, ход эволюции, отраженный вторым деревом (укорененным), неправдоподобен (по дереву, от общего предка образовались эукариотическая последовательность и группа эукариотических и прокариотических последовательностей, которая затем делится на две группы: прокариотическая и смешанная, то есть грибы образовывались несколько раз независимо).
Поэтому первое изображение лучше отражает мое представление о дереве (его проще объяснить, так как оно не предлагает строгий путь эволюции).

Заметим, что рассмотренные последовательности – не ортологи, и поэтому могут не отражать ход эволюции организмов.

Таким образом, наиболее вероятный ход эволюции последовательностей:
От гипотетического предка образовались два паралога. Отодного из них произошли последовательности AROE_LACLA (Fungi) и ARO1_PNECA (Bacteria) и DHQA_EMENI (Fungi). От другой ветви образовались прокариотические последовательности Q8U7B7_AGRT5 и Q82M83_STRAW.

Метод ближайших соседей (NJ)

С помощью программы emma построено множественное выравнивание последовательностей из PF08501.fasta. Далее получена два изображения дерева (его скобочная структура – файл NJ.txt, программа emma выдает ее как файл *.dnd)
(
AROE_LACLA:0.33873,
(
DHQA_EMENI:0.35999,
ARO1_PNECA:0.29433)
:0.02257,
(
Q8U7B7_AGRT5:0.25152,
Q82M83_STRAW:0.27121)
:0.06858);
 
drawtree drawgram

Заметим, что второе изображение не несет никакого смысла, так как использованный метод не позволяет строить укорененной дерево.
Полученное дерево в целом сходно с деревом, построенным с помощью алгоритма UPGMA. В обоих деревьях три последовательности образуются примерно в одно время. Однако второе дерево можно интерпретировать иначе.

Получаем сценарий эволюции:
От общего предка произошли две гипотетические последовательности, которые дали начало двум группам последовательностей. Первая группа включает две эукариотические (Fungi/Ascomycota) последовательности: ARO1_PNECA и DHQA_EMENI. Вторая группа – прокариотические последовательности, причем сначали от общей ветви отделилась AROE_LACLA, а затем разделились Q8U7B7_AGRT5 и Q82M83_STRAW.

Последовательность AROE_LACLA отделяется от общей прокариотической группы очень рано, сразу после образования эукариотической и прокариотической группы. Дерево похоже на звездное. Возможно, именно поэтому два алгоритма дали разный результат.


©Семенюк Павел