Алгоритмы реконструкции деревьев

  1. Укоренение в среднюю точку

    Дерево, построенное методом neighbor-joining,

    (LACDA:0.18941,(ENTFA:0.25376,((BACSU:0.18515,GEOKA:0.15788):0.08865, (FINM2:0.20853,(CLOB1:0.20884,CLOTE:0.16024):0.21712):0.14315):0.03959):0.26602,LACAC:0.19687);

    было скопировано в файл intree (без расширения). Далее была запущена программа retree.exe. После соглашения со всеми настройками (по умолчанию), программа построила дерево:



    Т.к. необходимое дерево должно быть укорененно в среднюю точку ("Midpoint root the tree") был выбран параметр M. Вот, что получилось:



    Укоренение произошло в следующую ветвь:
    (FINM2,(CLOB1,CLOTE)) vs (((LACAC,LACDA),ENTFA),(BACSU,GEOKA))
    Данное дерево соответствует правильному. С деревом, построенным методом максимальной экономии, сделать аналогичную опреацию не получится, т.к. метод fprotpars не основывается на молекулярных часах и не выдает длины ветвей. Также не имеет смысла применять данную программу к дереву, построенному методом UPGMA, т.к. он выдает уже укоренённое дерево, кстати, в моём случае укоренённые деревья получились разными.
  2. Использование внешней группы

    -к файлу с невыровненными последовательностями белков сначала была добавлена последовательность белка того же семейства из кишечной палочки (в качестве внешней группы):
    seqret sw:efts_ecoli stdout >> EFTS_2.fasta
    -затем было построено выравнивание всех последовательностей и результат дан на вход программе fprotpars:
    muscle -in EFTS_2.fasta -out EFTS_2_aligned.fasta
    fprotpars -sequence EFTS_2_aligned.fasta -outfile efts_2.fprotpars
    Получилось 2 неукоренённых дерева:



    После обработки программой retree, указав в качестве действия "select an Outgroup", а в качестве номера - тот, что программа retree присвоила листу ECOLI (9), получилось следующее:



    Если убрать аутгруппу, то полученное укорененное дерево не соответствует укоренению правильного дерева, положение листа EFTS ENTFA другой (в предыдущих деревьях он находится в ветви ((LACAC,LACDA),ENTFA), а не в ((GEOKA,BACSU),ENTFA).
  3. Бутстрэп

    -Создано 100 бутстрэп-реплик выравнивания белков протеобактерий программой fseqboot: результат.
    -По полученным репликам созданы деревья программой fprotpars:
    fprotpars -sequence efts_aligned.fseqboot -outfile efts_2_fsq.fprotpars
    Cкобочные формулы и изображения полученных деревьев.
    -Из полученных деревьев создано единое дерево по принципу "расширенного большинства" (extended majority rule tree):
    fconsense -in efts_aligned.treefile -outfile efts_aligned.fconsense
    Результат
    Ветви, не получившие большинства:

    (GEOKA,BACSU,ENTFA) vs (CLOTE,CLOB1,FINM2,LACDA,LACAC) получила поддержку 32.50
    Такая же ветвь получилась в №2 (использование аутгруппы).

    (GEOKA,ENTFA,LACDA,LACAC) vs (CLOTE,CLOB1,FINM2,BACSU) получила поддержку 1.50
    (BACSU,ENTFA) vs (CLOTE,CLOB1,FINM2,GEOKA,LACDA,LACAC) получила поддержку 0.50
    Здесь все положение "портит" BACSU.

    Дерево, построенное бустрэп-анализом соответствует дереву, построенному с использованием аутгруппы. Также, оно идентично дереву, посроенным программой fprotpars без бутсрэп-анализа.

© Anastasia Maslova, 2011