Филогенетические деревья, реконструированные разными способами.


На главную страницу второго семестра

Для реконструкции филогенетических деревьев использовалось "эталонное" выравнивание доменов семейства Asparaginase (точнее, его участок - см. benchmark.msf - в задании разрешается), полученное из базы данных Pfam (как это происходило - см. страничку"Сравнение фрагмента полного множественного выравнивания...". Вот:
                                                                                                                                                                               
                                            *                 2 0                   *                 4 0                   *                 6 0                   *          
A S P G _ M Y C L E   :   G V V V T H G T D T M E E T A L W L D L T Y A G - N V P V V L T G A M R S A D A P N A D G P T N L R E A L A V A A S P A A R G V G V L V S F   :   6 9
A S P G 2 _ Y E A S   :   G A V V T H G T D T M E E T A F F L D L T I N S - E K P V C I A G A M R P A T A T S A D G P M N L Y Q A V S I A A S E K S L G R G T M I T L   :   6 9
A S P G 1 _ B A C S   :   G F V I T H G T D T M A Y T S A A L S Y M L Q H A K K P I V I T G S Q I P I T F Q K T D A K K N I T D A I R F A C E G - - - V G G V Y V V F   :   6 7
A S P G 4 _ S C H P   :   G I V I T H G T D S L E E T A M F L D L T I S T - A K P I V V V G A M R P S T A I G A D G P M N L L N A V A V A S S N Q S M G R G T L V L L   :   6 9
G A T D _ M E T K A   :   G V V I G H G T D T M A F T A A A L S F V I E G L N G P V V L V G A Q R S S D R P S S D A A S N L I A A C A F A G D G E - - V G E V T V C M   :   6 8
                          G   V     H G T D         T       L                   P         G                     D       N       A       A                                      

Построение дерева по алгоритму UPGMA.

Для работы была создана Excel-книга UPGMA.xls.

  1. Построние матрицы "наивных" эволюционных расстояний между последовательностями "эталонного" множественного выравнивания домена.

    Эволюционным расстоянием (D) считаем величину D = 100 – P, где P — процент идентичности. На основании матрицы попарных совпадений (см. "Практикум 10") проводились расчеты; была создана матрица попарных эволюционных расстояний.
    Результат - см. UPGMA.xls ; лист "Distances".

  2. Построение дерева.

    Результат - см. UPGMA.xls ; лист "UPGMA". Порядок действий - cогласно алгоритму UPGMA (см. "Подсказки..." - подробное описание):

Получение и cравнение 2 изображений построенного дерева.

Для выполнения использованы 2 программы из Online-версии пакета Phylip: drawtree и drawgram (все параметры по умолчанию).
На вход обеих программ подается правильная скобочная структура, а на выходе получается картинка в Postscript-формате в виде файла plotfile.ps (cоответственно, просмотр через GhostView либо Word (Insert, далее Picture, далее From file)).

Визуализация такая:
Изображение, полученное drawgram. Изображение, полученное drawtree.

Программа drawgram построила укорененное дерево, а программа drawtree — неукорененное. Объективно, они дают представления о топологии, но не дают (связано это с работой алгоритма UPGMA (расстояния вычислялись как среднее арифметическое): "Алгоритм строит ультраметрическое дерево, а это означает, что скорость эволюции предполагается одинаковой для всех ветвей дерева. Использовать этот алгоритм имеет смысл только в случае ультраметрических данных (справедливости «молекулярных часов»)".) - о скоростях мутаций, "приведших" к формированию последовательностей. Да и насчет топологии - тоже следует уточнить:"помехой" может стать длина рассматриваемого участка выравнивания (малый объем выборки).

Лучше мое представление о данном дереве отражает вариант drawgram - укорененное дерево, т.к., строя правильную скобочную структуру в соответствии с алгоритмом UPGMA, мы "последовательно двигались" от листьев к корню (наличие корня и отражено в выдаче drawgram). Неукорененное дерево от drawtree в известной мере затрудняет кратко описать сценарий эволюции, т.к. по нему неясно, где может вообще находиться гипотетический общий предок.

Cценарий эволюции (по реконструкции drawgram): от гипотетической общей предковой последовательности домена (я считаю, что говорить при некоторых допущениях можно именно о последовательности домена. Обоснование - работа над заданием 12 практикума (выяснилось, что белки с доменом аспарагиназа - преимущественно однодоменные)) аспарагиназы произошли предковые последовательности двух типов. От одной из них поизошли последовательности домена аспарагиназы BACILLUS SUBTILIS (ASPG1_BACSU) и METHANOPYRUS KANDLERI (GATD_METKA) ; от другой - последовательность домена аспарагиназы MYCOBACTERIUM LEPRAE (ASPG_MYCLE) и предковая последовательность домена аспарагиназы SCHIZOSACCHAROMYCES POMBE(ASPG4_SCHPO) и SACCHAROMYCES CEREVISIAE (ASPG2_YEAST). В свою очередь, эта предковая последовательность - последняя из вышеназванных - дала начало соответствующим последовательностям SACCHAROMYCES CEREVISIAE и SCHIZOSACCHAROMYCES POMBE.

Примечания (информация по систематике; получена через поисковую систему SRS - http://srs.ebi.ac.uk/):
BACILLUS SUBTILIS (систематика: BACTERIA; FIRMICUTES; BACILLALES; BACILLACEAE; BACILLUS)
METHANOPYRUS KANDLERI (систематика: ARCHAEA; EURYARCHAEOTA; METHANOPYRI; METHANOPYRALES; METHANOPYRACEAE; METHANOPYRUS)
MYCOBACTERIUM LEPRAE (BACTERIA; ACTINOBACTERIA; ACTINOBACTERIDAE; ACTINOMYCETALES; CORYNEBACTERINEAE; MYCOBACTERIACEAE; MYCOBACTERIUM)
SCHIZOSACCHAROMYCES POMBE (EUKARYOTA; FUNGI; ASCOMYCOTA; SCHIZOSACCHAROMYCETES; SCHIZOSACCHAROMYCETALES; SCHIZOSACCHAROMYCETACEAE; SCHIZOSACCHAROMYCES) и SACCHAROMYCES CEREVISIAE (EUKARYOTA; FUNGI; ASCOMYCOTA; SACCHAROMYCOTINA; SACCHAROMYCETES; SACCHAROMYCETALES; SACCHAROMYCETACEAE; SACCHAROMYCES)
SACCHAROMYCES CEREVISIAE (EUKARYOTA; FUNGI; ASCOMYCOTA; SACCHAROMYCOTINA; SACCHAROMYCETES; SACCHAROMYCETALES; SACCHAROMYCETACEAE; SACCHAROMYCES)

Получение и описание дерева, построенного по методу ближайших соседей.

Рассматриваемый фрагмент эталонного выравнивания переведен в формат FASTA: benchmark.fasta.Далее - строим множественное выравнивание последовательностей из benchmark_m.fasta с помощью программы emma, руководящее дерево (guide tree) сохранено в файле NJ.dnd. Этот файл содержит правильную скобочную структуру дерева, вот она:
( ( ASPG_MYCLE:0.19698, ( ASPG1_BACSU:0.30304, GATD_METKA:0.24920) :0.11996) :0.07113, ASPG2_YEAST:0.19032, ASPG4_SCHPO:0.18649);

Результат визуализации:
Изображение, полученное drawgram
(укорененное дерево... Филограмма).
Изображение, полученное drawtree
(неукорененное дерево).

Итак, построение дерева методом ближайших соседей (neighbor-joining) произведено. Т.к. метод строит неукорененное дерево, то оптимальной является визуализация drawtree (неукорененное дерево - его надо понимать как множество всех возможных укоренений). Поэтому и стратегию, в данном случае, разумно приводить по неукорененному дереву. В свою очередь, неукорененные NJ-дерево и UPGMA-дерево фактически оказываются одинаковыми: одинаково взаимное расположение ветвей; про длину ветвей речь не идет (алгоритмы ведь разные). Что касается укорененных NJ-дерева и UPGMA-дерева, то здесь есть некоторое расхождение (а именно, более раннее "отщепление" последовательности ASPG_MYCLE).
Ответ на ГЛАВНЫЙ вопрос: при реконструкции деревьев разными методами в целом (речь идет о топологии - по "временным" показателям (скорость накопления мутаций в различных систематических группах) сравнивать некорректно /алгоритмы-то разные/) сценарий эволюции не изменился.


©NADEZDA TUKHTUBAEVA,2006