REFSEQ_DNA:NC_001133 NC_001133 Saccharomyces cerevisiae S288c chromosome I, complete sequence. 230218 REFSEQ_DNA:NC_001134 NC_001134 Saccharomyces cerevisiae S288c chromosome II, complete sequence. 813184 REFSEQ_DNA:NC_001135 NC_001135 Saccharomyces cerevisiae S288c chromosome III, complete sequence. 316620 REFSEQ_DNA:NC_001136 NC_001136 Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 1531933 REFSEQ_DNA:NC_001137 NC_001137 Saccharomyces cerevisiae S288c chromosome V, complete sequence. 576874 REFSEQ_DNA:NC_001138 NC_001138 Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 270161 REFSEQ_DNA:NC_001139 NC_001139 Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 1090940 REFSEQ_DNA:NC_001140 NC_001140 Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 562643 REFSEQ_DNA:NC_001141 NC_001141 Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 439888 REFSEQ_DNA:NC_001142 NC_001142 Saccharomyces cerevisiae S288c chromosome X, complete sequence. 745751 REFSEQ_DNA:NC_001143 NC_001143 Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 666816 REFSEQ_DNA:NC_001144 NC_001144 Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 1078177 REFSEQ_DNA:NC_001145 NC_001145 Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 924431 REFSEQ_DNA:NC_001146 NC_001146 Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 784333 REFSEQ_DNA:NC_001147 NC_001147 Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 1091291 REFSEQ_DNA:NC_001148 NC_001148 Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 948066
В качестве примера, будем работать с у же знакомым нам белком CRH_BACSU.
Ac EMBL: Z94043
CDS: 12612..12869
>Z94043 Z94043.1 B.subtilis genomic DNA fragment (88 kb) atggttcaacagaaagtggaagttcgattaaagacaggactgcaagcacgtcctgctgct ttgtttgtacaagaagcaaaccggtttacgtcagatgtgtttcttgagaaggatgggaaa aaagtaaacgccaaaagcatcatggggctgatgagccttgcggtaagcacaggcactgag gttaccttgattgcccagggagaagatgaacaagaggcgctggagaagctggctgcttac gttcaagaagaagtttag
Для примера будем работать с белком crh_bacsu и его близким гомологом crh_bachd. Последовательность гена-гомолога crh_bachd:
>BA000004 BA000004.3 Bacillus halodurans C-125 DNA, complete genome. ttggttgaaaaacaagtagaagtgaagctgaaaacaggattacaagctcgccctgctgct ctctttgttcaggaagcgaatcgcttcacctcagaaatcttcattgagaaggatggaaag aaagtaaatgccaaaagcatcatgggtctcatgagcttggccattggctccggatcaacg atcacattgatcacagaaggaaatgatgaacaggaagcgatggaggctcttatcgcattc atcgaaaaggaataa
10 20 30 40 50 60 70 80 CRH_BACSU MVQQKVEVRLKTGLQARPAALFVQEANRFTSDVFLEKDGKKVNAKSIMGLMSLAVSTGTEVTLIAQGEDEQEALEKLAAYVQEEV ::...:::.::::::::::::::::::::::..:.:::::::::::::::::::. .:. .::: .: :::::.: : :....: CRH_BACHD MVEKQVEVKLKTGLQARPAALFVQEANRFTSEIFIEKDGKKVNAKSIMGLMSLAIGSGSTITLITEGNDEQEAMEALIAFIEKE- 10 20 30 40 50 60 70 80
Z94043 1 a-tggtt---caac-ag-a-aagtggaagttc-gattaaagacaggactg 42 ||||| .||| || | |||| |||| | || || ||||||.|. BA000004 1 -ttggttgaaaaacaagtagaagt-gaag--ctga--aa--acaggatta 42 Z94043 43 caagcacgtcctgctgctttgtttgtacaagaagcaaaccggtttacgtc 92 |||||.||.|||||||||.|.|||||.||.|||||.||.||.||.||.|| BA000004 43 caagctcgccctgctgctctctttgttcaggaagcgaatcgcttcacctc 92 Z94043 93 ag--atgtgtttc-ttgagaaggatgggaaa-aaagtaaacgccaaaagc 138 || || .||| ||||||||||| ||||| ||||||||.||||||||| BA000004 93 agaaat---cttcattgagaaggat-ggaaagaaagtaaatgccaaaagc 138 Z94043 139 atcatggggctgatgagcctt-gc----gg-taagcacagg--c-actga 179 ||||||||.||.||||| ||| || || | | | || | || || BA000004 139 atcatgggtctcatgag-cttggccattggct---c-c-ggatcaac-ga 181 Z94043 180 ggttaccttgattgcccag--ggagaa-gatgaacaagaggcgctggaga 226 |.||.||||| |.||| ||| || ||||||||.||.|||.||||| BA000004 182 --tcacattgat--cacagaagga-aatgatgaacaggaagcgatggag- 225 Z94043 227 agctggctgctta-cg--ttca-agaagaag--tttag 258 ||| |||| || |||| .||| ||| .|.| BA000004 226 -gct-----cttatcgcattcatcgaa-aaggaataa- 255
>crh_bacsu atggttcaacagaaagtggaagttcgattaaagacaggactgcaagcacgtcctgctgct ttgtttgtacaagaagcaaaccggtttacgtcagatgtgtttcttgagaaggatgggaaa aaagtaaacgccaaaagcatcatggggctgatgagccttgcggtaagcacaggcactgag gttaccttgattgcccagggagaagatgaacaagaggcgctggagaagctggctgcttac gttcaagaagaagtt >crh_bachd atggttgaaaaacaagtagaagtgaagctgaaaacaggattacaagctcgccctgctgct ctctttgttcaggaagcgaatcgcttcacctcagaaatcttcattgagaaggatggaaag aaagtaaatgccaaaagcatcatgggtctcatgagcttggccattggctccggatcaacg atcacattgatcacagaaggaaatgatgaacaggaagcgatggaggctcttatcgcattc atcgaaaaggaa---
Поскольку программа tranalign строит выравнивание днк по белковому выравниванию,
то оно очевидно должно быть близко по структуре к белковому.
Если tranalign использует такие же алгоритмы выравнивания, как и needle, то их выравнивания должны быть схожи.
Этот хорошо заметно из результатов.
Например, в выравнивании tranalign, как и в белковом needle нет гэпов.
Гэпы могли появиться в таком выравнивании, только если они есть в белковом.
В выравнивании днк при помощи needle много гэпов, так как программа пыталась найти наилучше выравнивающиеся участки.
Однако такое выравнивание не имеет биологического смысла, в нем слишком много гэпов.
Производился поиск гена MOH1 Moh1p.
Первая же ссылка - на страницу данного гена