Terms
|
Other results
|
Home page
|
|
|
Задание первое.
Все индексные файлы полученны. для обхода по одному геному файлы лежат в папке Term3/BLAST/ForOneGen. Для третьего же и четвертого задания файлы можно найти в папке Term3/BLAST/BLASTN
Задание второе+третье.
Поиск гомологов SUCD_ECOLI |
Геном Xanthomonas campestris | 3 генома сразу |
Число находок с Е-value<0,001 |
2 | 5 |
Характеристика лучшей находки: |
|
E-value находки |
3e-92[во второй раз - 7e-92] | e-127 |
|
AC соответствующей записи EMBL |
AE012424 | AE008730 |
|
координаты выравнивания(-ий) в записи EMBL |
7991..8863 | 9264..10130 |
|
Координаты CDS в записи EMBL (если они есть) |
7988..8863 | 9264..10133 |
|
AC UniProt в записи EMBL (если есть) |
Q8P677 | Q8ZQU0 |
|
Примечания |
комплементарная цепь в EMBL | - |
Лучшая находка очень хорошая т.к.при хорошем e-Value выровнялся практически весь фрагмент. Т.е. хорошее совпадение наблюдаеться не у небольшого кусочка, а у практически всего фрагмента целиком
Заметим, что при использовании большего колличества геномов у предыдущей лучшей находки возросло e-Value что не удивительно, т.к. при увеличении размера базы увеличиваеться возможность случайного совпадения поэтому при одинаковом количестве bits(332) - т.е. сумарного веса выравнивание e-Value больше. Изменение лучшей находки соответствует тому, что в другом(по отношнию к первому геному) храниться более близкий родственник изучаемого белка.
Задание четвертое
Поиск гомологов SUCD_ECOLI |
Геномы 3х бактерий |
Число находок с Е-value<0,001 |
3 |
Характеристика лучшей находки: |
|
|
E-value находки |
0.0 |
|
AC соответствующей записи EMBL |
AE008730 |
|
координаты выравнивания(-ий) в записи EMBL |
9264..10118 |
|
Координаты CDS в записи EMBL (если они есть) |
9264..10133 |
|
AC UniProt в записи EMBL (если есть) |
Q8ZQU0 |
В последнем задании программа строит выравнивание по ДНКовым последовательностям. Если посмотреть на результаты то окажеться,что таже самая находка осталась в лидерах, но при этом сильно уменьшила e-Value. Но если посмотреть на границы выравнивания, то все становиться понятным - во последнем выравнивании обрезанна концевая часть последовательности. Вероятно дальнейшая ДНКовая последовательность сильно отличаеться от той, с которой мы сравниваем поэтому эта программа ее в выравнивание не включила. Но из-за вырожденности генетического кода в случае белкового выравнивания этот кусочек в него включаеться. Что увеличивает длинну последовательности но из-за не полного соответсвия увеличивает e-Value.
Описание соответствующего cds в EMBL:
similar to E. coli succinyl-CoA synthetase, alpha subunit (AAC73823.1); Blastp hit to AAC73823.1 (289 aa), 95% identity in aa 1 - 289
Выравнивание
Salmonella typhimurium LT2, section 38 of
220 of the complete genome
Score = 894 bits (451), Expect = 0.0
Identities = 754/855 (88%)
Strand = Plus / Plus
Query: 1 atgtccattttaatcgataaaaacaccaaggttatctgccagggctttaccggtagccag 60
|||||| ||||||| ||||| | ||||||||||||||||||||||| ||||||||||||
Sbjct: 9264 atgtccgttttaattaataaagataccaaggttatctgccagggcttcaccggtagccag 9323
Query: 61 gggactttccactcagaacaggccattgcatacggcactaaaatggttggcggcgtaacc 120
|||||||||||||| |||||||| ||||| ||||| || | ||||| |||||||||||
Sbjct: 9324 gggactttccactccgaacaggcgattgcttacggtacgcagatggtgggcggcgtaacg 9383
Query: 121 ccaggtaaaggcggcaccacccacctcggcctgccggtgttcaacaccgtgcgtgaagcc 180
|| || |||||||||||||| || || || ||||||||||||||||||||||| |||||
Sbjct: 9384 ccgggcaaaggcggcaccacgcatctggggctgccggtgttcaacaccgtgcgcgaagcg 9443
Query: 181 gttgctgccactggcgctaccgcttctgttatctacgtaccagcaccgttctgcaaagac 240
|| | || || || || ||||| || ||||||||||| || || |||||||||||||||
Sbjct: 9444 gtagaagctaccggtgcgaccgcatccgttatctacgtcccggcgccgttctgcaaagac 9503
Query: 241 tccattctggaagccatcgacgcaggcatcaaactgattatcaccatcactgaaggcatc 300
||||| |||||||| || |||||||||||||||||||||||||||||||| ||||| ||
Sbjct: 9504 tccatcctggaagcgattgacgcaggcatcaaactgattatcaccatcaccgaaggtatt 9563
Query: 301 ccgacgctggatatgctgaccgtgaaagtgaagctggatgaagcaggcgttcgtatgatc 360
|||||||||||||||||||||||||||||||||||||| ||||||||||| || ||||||
Sbjct: 9564 ccgacgctggatatgctgaccgtgaaagtgaagctggacgaagcaggcgtgcgcatgatc 9623
Query: 361 ggcccgaactgcccaggcgttatcactccgggtgaatgcaaaatcggtatccagcctggt 420
||||||||||||||||| || ||||| ||||| |||||||||||||| ||| ||| |||
Sbjct: 9624 ggcccgaactgcccaggtgtgatcaccccgggcgaatgcaaaatcggcatcatgccgggt 9683
Query: 421 cacattcacaaaccgggtaaagtgggtatcgtttcccgttccggtacactgacctatgaa 480
|||||||| || |||||||||||||||||||||||||||||||| || |||||||| |||
Sbjct: 9684 cacattcataagccgggtaaagtgggtatcgtttcccgttccggcacgctgacctacgaa 9743
Query: 481 gcggttaaacagaccacggattacggtttcggtcagtcgacctgtgtcggtatcggcggt 540
|||||||| |||||||| || ||||||||||| ||||| ||||| || |||||||||||
Sbjct: 9744 gcggttaagcagaccaccgactacggtttcggccagtccacctgcgtgggtatcggcggc 9803
Query: 541 gacccgatcccgggctctaactttatcgacattctcgaaatgttcgaaaaagatccgcag 600
|||||||| |||||||||||||||||||| || || || ||||| | |||||||||||
Sbjct: 9804 gacccgattccgggctctaactttatcgatatcctgaaactgttccaggaagatccgcag 9863
Query: 601 accgaagcgatcgtgatgatcggtgagatcggcggtagcgctgaagaagaagcagctgcg 660
|| ||||||||||||||||||||||||||||||||||| || ||||||||||| || ||
Sbjct: 9864 actgaagcgatcgtgatgatcggtgagatcggcggtagtgcagaagaagaagcggcggct 9923
Query: 661 tacatcaaagagcacgttaccaagccagttgtgggttacatcgctggtgtgactgcgccg 720
||||| ||||| ||||| |||||||| ||||| || || ||||| ||||| || ||||||
Sbjct: 9924 tacattaaagaccacgtgaccaagccggttgttggctatatcgcgggtgttaccgcgccg 9983
Query: 721 aaaggcaaacgtatgggccacgcgggtgccatcattgccggtgggaaagggactgcggat 780
|||||||| ||||||||||||||||| ||||||||||||||||| ||||| |||||||||
Sbjct: 9984 aaaggcaagcgtatgggccacgcgggcgccatcattgccggtggtaaaggcactgcggat 10043
Query: 781 gagaaattcgctgctctggaagccgcaggcgtgaaaaccgttcgcagcctggcggatatc 840
|| |||||||| || ||||||||||| |||||||||||||||||||||||||| ||||||
Sbjct: 10044 gaaaaattcgcagcgctggaagccgcgggcgtgaaaaccgttcgcagcctggccgatatc 10103
Query: 841 ggtgaagcactgaaa 855
|| ||||| ||||||
Sbjct: 10104 ggcgaagcgctgaaa 10118
|