Четвертый семестр

Реконструкция с использовнием 16S pPHK

Бактерии и ссылки из их записей Swissprot на записи EMBL

Бактерия EMBL-запись Координаты
GEOKA EMBL; BA000043; BAD75499.1; -; Genomic_DNA 10421..11973
BACAN EMBL:AE016879; AAP24167.1; -; Genomic_DNA.
EMBL; AE017334; AAT29193.1; -; Genomic_DNA.
EMBL; AE017225; AAT52450.1; -; Genomic_DNA.
29129..30635
BACSU EMBL; U43929; AAC45959.1; -; Genomic_DNA.
EMBL; D50302; BAA08834.1; -; Genomic_DNA.
EMBL; AL009126; CAB11895.2; -; Genomic_DNA.
30279..31832
ENTFA EMBL; AE016830; AAO80078.1; -; Genomic_DNA.248466..249987
CLOB1 EMBL; CP000726; ABS35648.1; -; Genomic_DNA 9282..10783
CLOTE EMBL; AE015927; AAO37054.1; ALT_INIT; Genomic_DNA complement(8715..10223)
FINM2 EMBL; AP008971; BAG07576.1; -; Genomic_DNA. 197837..199361
LISMO EMBL; AL591980; CAD00707.1; -; Genomic_DNA.96266..97811

В правильном дереве 5 нетривиальных ветвей. При различных реконструкциях часть из них может быть потеряна.

Дерево Сколько ветвей совпадают с правильным? Какие отсутствуют
fprotpars 2 ветви 1. (BACAN, BACSU)
2. (GEOKA, BACAN, BACSU, LISMO)
3. (GEOKA, BACAN, BACSU)
fneighbor 4 1. {FINM2,CLOTE, CLOB1, ENTFA} vs {LISMO, GEOKA, BACAN,BACSU}
upgma правильное дерево
retree 3 1. {FINM2,CLOTE, CLOB1, ENTFA} vs {LISMO, GEOKA, BACAN,BACSU}
2. {FINM2,CLOTE, CLOB1, ENTFA,LISMO} vs {GEOKA, BACAN,BACSU}
выделение внешней группы 4 1. {FINM2,CLOTE, CLOB1, ENTFA} vs {LISMO, GEOKA, BACAN,BACSU}
fdnapars 1 1. Выделявшая LISMO, BACAN, BACSU и GEOKA.
2. Выделявшая BACAN, BACSU и GEOKA.
3. Выделявшая CLOTE, CLOB1, FINM
4. Выделяющая {BACAN, BACSU} против остальных.

Чтобы найти эти ссылки на записи EMBL, потребовалось получить соответствующие записи Swissprot командой entret sw:xxx, где ххх - Swissprot ID какого-нибудь белка этих бактерий.

Команда для получения выравнивания: muscle -in 16s.fasta -out 16s_aligned.fasta, где bacteria.fasta - файл с последовательностями, а 16s_aligned.fasta - файл с выравниванием.

Сравнение деревьев

Скобочная формула: (((((CP002491:0.06056,AE017334:0.05135):0.03058,BA000043:0.05433):0.07739, (FR773526:0.03602,AE015927:0.04161):0.05432):0.05470,AP008971:0.09895):0.40577, CP002468:0.31591,LISMO:0.29765);

Это дерево построено программой fdnapars и отличается от правильного тем, что BACAN и BACSU не выделяются как родственные организмы, наоборот они очень далеки друг от друга.
Появились ветви, выделяющие BACAN и ENTFA; и BACAN, ENTFA и GEOKA.
Зато больше нет ветви, выделявшей LISMO, BACAN, BACSU и GEOKA.
В целом, деревья, построенные по белкам, ближе к верному. Cреди ошибок,допущенных в этом дереве, есть типичные и нетипичны: больше нигде нельзя найти ветви, выделяющие BACAN и ENTFA; и BACAN, ENTFA и GEOKA. Пропущенная ветвь, выделявшая LISMO, BACAN, BACSU и GEOKA, отсутствует и в большинстве белковых деревьев (см. таблицу).

Если судить по количеству "пропавших" ветвей, этот метод хуже всех методов реконструкции по белкам, за исключением fprotpars.

Сравнение расстояний

По сравнению с деревьями fprotpars, joining, retree в новом увеличилось расстояние от LISMO и BACAN до их ближайших соседей.

Дерево гомологов

Паралоги CLPX_BACSU: CLPY_BACSU, CLPE_BACSU, CLPC_BACSU.
CLPX_BACAN и -GEOKA; CLPX_CLOTE и -CLOB1, CLPY_BACSU и HSLU_BACAN - ортологи.