Назад

Визуализация деревьев

Цель задания – пользуясь программами пакета PHYLIP,
восстановить предковую последовательность для выравнивания
мутированных последовательностей и сравнить её с реальной предковой последовательностью.

С помощью программы dnaml были получены все узловые последовательности, в том числе исходная:

>reconstructed by dnaml prec
ATCTGACTTAGAkTTACACTAGGCCAGGAATCCAAAATGATAGGAGCAAATTTATATCGA
GTTAATGAGCCCCTTATAATGCGGGGCGGGGCAAACGGGGCCCAAAGGGTCGGTGAmAAA
GCCCAGATTAATGTAGTTGCGCCCCACAGGCTATGGGACTAACTTTGCAGCGAGAGCGTT
ACGTAAAACGATTTTGGGGTCGATCTGCCGCCCGAACAGAAAGCAGTTGCAAAAGGCGGA
CATTCCTTCCTCGACCATGGCAAAGGGACCTCTCTGCCGTGCACCAAATATTGAAGGAGT
TTCACAGGAGGGTCAGCAmGTCACTTTCGTATCCCTGGGGACAAAGGTCACACTGACTGG
GGACTAGATACGGGGAATCCACTCAATGTGACGCCGACGGGCTTCCATTGAGAACAGATT
GCAATCGATGCCTTAATGGCACATTGATAGAAATAAATAATTAAAATCACAAGCAATTCG
TTAATGGTCCATGTTGGCCGGTATCAAATGkAGGATATACCTAAACCCCCGGGCGATTGC
GGTTATTGTAAAGGCTGTGTTGGATGCGAGAGA

C помощью программы needle было построено выравнивание данной последовательности с истинной последовательностью:
AAW51185           1 atgtgtcact--ggtttacacttattcaggaatgcacaatgaacggaggt     48
                     ||.||  |||  |.:|||||||....|||||||.||.|||||..||||  
reconstructed      1 aTCTG--ACtTaGaktTACACTAgGCCaGGAaTCCAaAATGATAGgAG--     46

AAW51185          49 cc-----tatgaaacgttttagtctggc-----tattctggcgctggttg     88
                      |     |||  |.||..|||.|..|.|     ||.|..||.||.||   
reconstructed     47 -cAAATttAt--aTCgAgTTAATGaGCCCCTTAtAATGCGGGGCGgg---     90

AAW51185          89 ttgcaaccggcgcacaagctgccagtgaaaaagtcgagatgaacctcgtc    138
                       ||||.|||.||.|||...|.|.||||:||||.|.||||.||..|.||.
reconstructed     91 --gCAaACgGGGCCCAAaGGGTcGGTgAmAAaGCCCAgAtTAATGTAgTT    138

AAW51185         139 acgtcgcaaggggtagggcagtcaattggtagcgtcaccattactgaaac    188
                     .||.|.||..||.||.||.|.|.|.||.|.||||..|.|.||||..|||.
reconstructed    139 gCgCcCCACAGGcTAtGGGACTAacTTTgCAGCGAgAGCGTTACGTAaAA    188

AAW51185         189 cgataaaggtctggagt-----tttcgcccgatctgaaagcattaccccc    233
                     ||||     |.|||.||     |..|||||||.|.|||||||.|..|...
reconstructed    189 CGAt-----TTTGGgGTCGatCtGCcgCcCGAACAGAAaGCAGTTgCaAA    233

AAW51185         234 cggtgaacatggcttccatatt----catgccaaaggaagctgccagcca    279
                     .||.|.||||..|||||    |    ||||.||||||.|.||..|.|||.
reconstructed    234 AGgCGGACaTTcCTTCC----TCGacCATGGCAAAgGGAcCtcTCTGccg    279

AAW51185         280 gccaccaaagatggcaaagccagcgccgcgga-atccgcaggcggg----    324
                     ..|||||||.||.|.|             ||| .|.|.||||.|||    
reconstructed    280 TgCACCAAATAtTGAa-------------GGAGTTTCACaGgAGGGTCAg    316

AAW51185         325 -----catctt---gatcc------acaaaataccggtaaaca-tgaagg    359
                          || |||   .||||      |||||     ||| .||| |||..|
reconstructed    317 CAmGTCa-CTTTCGTATccCTGGGgACAAA-----GGt-cACAcTgACtG    359

AAW51185         360 gccagaaggtgccgggcatttaggcgatctgcctgc--actggtcgtcaa    407
                     |..|..||.|.|.|||.||..|..|.||.||.| ||  || ||.|.||.|
reconstructed    360 GGGACTaGataCGGGGAATcCACTCAATGTGaC-GCCGAC-GGGCtTCca    407

AAW51185         408 taatgacggcaaa--gctaccgatgccgtcatcgcgcctcgtctgaaatc    455
                     |  |||...||.|  ||.|.|||||||.|.||.||.|.|.|...|||||.
reconstructed    408 T--TGAGAAcAGATTGCAatcGATGCCtTaAtGGCACATTGAtAGaAAtA    455

AAW51185         456 actggatgaaatca-aagacaaagcgctgatggtccacgttggcggcgat    504
                     |.|...|.|||||| ||| |||..||.|.||||||||.||||||.|..||
reconstructed    456 AAtaaTTAAAATCACAAG-cAATTCGtTAATGGTCCAtgTTGGCCGGTAT    504

AAW51185         505 aatatgtccgatcaacctaaaccgctgggcggtggcggtgaacgctatgc    554
                     .|.|||:..|||..|||||||||.|.|||||.|.|||||.|..|..|.|.
reconstructed    505 CaAATGkAGGATATAcCTAAACCCCCGGGcGAttGCGgTTATTGTAaAGG    554

AAW51185         555 ctgtggtgta--------attaagtaa    573
                     |||||.||.|        |        
reconstructed    555 CtGtGTTGGATGCGAGAGA--------    573

Identity = 56.8% - весьма низкое значение. Необходимо отметить, что топология была восстановлена неправильно. Возможно, связано с особенностями метода Maximum Likelihood - например, из-за маленькой длины одной из ветвей – 7 – ветвь была привита не туда.

© Галкин Иван, 2005