Practice3 Design by Rhymester Dan
mailto:KovrovDV@rambler.ru
kodomo.fbb.msu.ru
Terms
Other results
Home page
 

Задание первое.

Все индексные файлы полученны. для обхода по одному геному файлы лежат в папке Term3/BLAST/ForOneGen. Для третьего же и четвертого задания файлы можно найти в папке Term3/BLAST/BLASTN

Задание второе+третье.

Поиск гомологов SUCD_ECOLI Геном Xanthomonas campestris3 генома сразу
Число находок с Е-value<0,001
2
5
Характеристика лучшей находки:
   E-value находки
3e-92[во второй раз - 7e-92]
e-127
  AC соответствующей записи EMBL
AE012424
AE008730
  координаты выравнивания(-ий) в записи EMBL
7991..8863
9264..10130
  Координаты CDS в записи EMBL (если они есть)
7988..8863
9264..10133
  AC UniProt в записи EMBL (если есть)
Q8P677
Q8ZQU0
  Примечания
комплементарная цепь в EMBL
-
Лучшая находка очень хорошая т.к.при хорошем e-Value выровнялся практически весь фрагмент. Т.е. хорошее совпадение наблюдаеться не у небольшого кусочка, а у практически всего фрагмента целиком
Заметим, что при использовании большего колличества геномов у предыдущей лучшей находки возросло e-Value что не удивительно, т.к. при увеличении размера базы увеличиваеться возможность случайного совпадения поэтому при одинаковом количестве bits(332) - т.е. сумарного веса выравнивание e-Value больше. Изменение лучшей находки соответствует тому, что в другом(по отношнию к первому геному) храниться более близкий родственник изучаемого белка.

Задание четвертое

Поиск гомологов SUCD_ECOLI
Геномы 3х бактерий
Число находок с Е-value<0,001
3
Характеристика лучшей находки:  
   E-value находки
0.0
  AC соответствующей записи EMBL
AE008730
  координаты выравнивания(-ий) в записи EMBL
9264..10118
  Координаты CDS в записи EMBL (если они есть)
9264..10133
  AC UniProt в записи EMBL (если есть)
Q8ZQU0
В последнем задании программа строит выравнивание по ДНКовым последовательностям. Если посмотреть на результаты то окажеться,что таже самая находка осталась в лидерах, но при этом сильно уменьшила e-Value. Но если посмотреть на границы выравнивания, то все становиться понятным - во последнем выравнивании обрезанна концевая часть последовательности. Вероятно дальнейшая ДНКовая последовательность сильно отличаеться от той, с которой мы сравниваем поэтому эта программа ее в выравнивание не включила. Но из-за вырожденности генетического кода в случае белкового выравнивания этот кусочек в него включаеться. Что увеличивает длинну последовательности но из-за не полного соответсвия увеличивает e-Value.
Описание соответствующего cds в EMBL:
similar to E. coli succinyl-CoA synthetase, alpha subunit (AAC73823.1); Blastp hit to AAC73823.1 (289 aa), 95% identity in aa 1 - 289
Выравнивание
Salmonella typhimurium LT2, section 38 of
             220 of the complete genome

 Score =  894 bits (451), Expect = 0.0
 Identities = 754/855 (88%)
 Strand = Plus / Plus

                                                                         
Query: 1     atgtccattttaatcgataaaaacaccaaggttatctgccagggctttaccggtagccag 60
             |||||| |||||||  ||||| | ||||||||||||||||||||||| ||||||||||||
Sbjct: 9264  atgtccgttttaattaataaagataccaaggttatctgccagggcttcaccggtagccag 9323

                                                                         
Query: 61    gggactttccactcagaacaggccattgcatacggcactaaaatggttggcggcgtaacc 120
             |||||||||||||| |||||||| ||||| ||||| ||  | ||||| ||||||||||| 
Sbjct: 9324  gggactttccactccgaacaggcgattgcttacggtacgcagatggtgggcggcgtaacg 9383

                                                                         
Query: 121   ccaggtaaaggcggcaccacccacctcggcctgccggtgttcaacaccgtgcgtgaagcc 180
             || || |||||||||||||| || || || ||||||||||||||||||||||| ||||| 
Sbjct: 9384  ccgggcaaaggcggcaccacgcatctggggctgccggtgttcaacaccgtgcgcgaagcg 9443

                                                                         
Query: 181   gttgctgccactggcgctaccgcttctgttatctacgtaccagcaccgttctgcaaagac 240
             || |  || || || || ||||| || ||||||||||| || || |||||||||||||||
Sbjct: 9444  gtagaagctaccggtgcgaccgcatccgttatctacgtcccggcgccgttctgcaaagac 9503

                                                                         
Query: 241   tccattctggaagccatcgacgcaggcatcaaactgattatcaccatcactgaaggcatc 300
             ||||| |||||||| || |||||||||||||||||||||||||||||||| ||||| || 
Sbjct: 9504  tccatcctggaagcgattgacgcaggcatcaaactgattatcaccatcaccgaaggtatt 9563

                                                                         
Query: 301   ccgacgctggatatgctgaccgtgaaagtgaagctggatgaagcaggcgttcgtatgatc 360
             |||||||||||||||||||||||||||||||||||||| ||||||||||| || ||||||
Sbjct: 9564  ccgacgctggatatgctgaccgtgaaagtgaagctggacgaagcaggcgtgcgcatgatc 9623

                                                                         
Query: 361   ggcccgaactgcccaggcgttatcactccgggtgaatgcaaaatcggtatccagcctggt 420
             ||||||||||||||||| || ||||| ||||| |||||||||||||| |||  ||| |||
Sbjct: 9624  ggcccgaactgcccaggtgtgatcaccccgggcgaatgcaaaatcggcatcatgccgggt 9683

                                                                         
Query: 421   cacattcacaaaccgggtaaagtgggtatcgtttcccgttccggtacactgacctatgaa 480
             |||||||| || |||||||||||||||||||||||||||||||| || |||||||| |||
Sbjct: 9684  cacattcataagccgggtaaagtgggtatcgtttcccgttccggcacgctgacctacgaa 9743

                                                                         
Query: 481   gcggttaaacagaccacggattacggtttcggtcagtcgacctgtgtcggtatcggcggt 540
             |||||||| |||||||| || ||||||||||| ||||| ||||| || ||||||||||| 
Sbjct: 9744  gcggttaagcagaccaccgactacggtttcggccagtccacctgcgtgggtatcggcggc 9803

                                                                         
Query: 541   gacccgatcccgggctctaactttatcgacattctcgaaatgttcgaaaaagatccgcag 600
             |||||||| |||||||||||||||||||| || ||  || ||||| |  |||||||||||
Sbjct: 9804  gacccgattccgggctctaactttatcgatatcctgaaactgttccaggaagatccgcag 9863

                                                                         
Query: 601   accgaagcgatcgtgatgatcggtgagatcggcggtagcgctgaagaagaagcagctgcg 660
             || ||||||||||||||||||||||||||||||||||| || ||||||||||| || || 
Sbjct: 9864  actgaagcgatcgtgatgatcggtgagatcggcggtagtgcagaagaagaagcggcggct 9923

                                                                         
Query: 661   tacatcaaagagcacgttaccaagccagttgtgggttacatcgctggtgtgactgcgccg 720
             ||||| ||||| ||||| |||||||| ||||| || || ||||| ||||| || ||||||
Sbjct: 9924  tacattaaagaccacgtgaccaagccggttgttggctatatcgcgggtgttaccgcgccg 9983

                                                                         
Query: 721   aaaggcaaacgtatgggccacgcgggtgccatcattgccggtgggaaagggactgcggat 780
             |||||||| ||||||||||||||||| ||||||||||||||||| ||||| |||||||||
Sbjct: 9984  aaaggcaagcgtatgggccacgcgggcgccatcattgccggtggtaaaggcactgcggat 10043

                                                                         
Query: 781   gagaaattcgctgctctggaagccgcaggcgtgaaaaccgttcgcagcctggcggatatc 840
             || |||||||| || ||||||||||| |||||||||||||||||||||||||| ||||||
Sbjct: 10044 gaaaaattcgcagcgctggaagccgcgggcgtgaaaaccgttcgcagcctggccgatatc 10103

                            
Query: 841   ggtgaagcactgaaa 855
             || ||||| ||||||
Sbjct: 10104 ggcgaagcgctgaaa 10118