BLAST

Поиск в геноме участков, кодирующих белки, похожие на заданный. (белок LIVK_ECOLI в геноме Salmonella typhimurium)

Начинаю выполнение задания с того, что с помощью seqret создаю файл с последовательностью своего белка. Далее создаю индексные файлы для поиска по геному сальмонеллы и запускаю tblastn.
Число находок с Е-value<0,001 1
Характеристика лучшей находки:  
   E-value находки 0.0
AC соответствующей записи EMBL AE008864
Координаты выравнивания в записи EMBL 11264-10158; 13367-12293
Координаты CDS в записи EMBL 11264-10155; 12264-13361
AC UniProt для этого CDS P0A1W6; P17215

Аналогичный поиск сразу в нескольких геномах

Создаю индексные файлы для поиска в трех геномах сразу, предварительно ради проверки проведя поиск в каждом отдельно взятом геноме. Из трех геномов только в геноме сальмонеллы было найдено 2 находки, в остальных tblastn не нашел ничего. Поэтому файл output_3gen.txt похож на файл output_st.txt. E-value двух находок не изменился.

Поиск гомологов с помощью программы BLASTN

Взял запись m29378 из EMBL, вырезал из неё нужный фрагмент с помощью seqret -sask, поискал в трех геномах гомологи с помощью blastN e-value 0.001.
Нашлось 3 последовательности, которые прошли по критерию e-value. Причем первая значительно лучше остальных двух (по e-value и score).
BlastN нашел обе последовательности, найденные tblastn, но e-value одной из них отличается в большую сторону (e-50 против e-163). E-value лучшей находки (=0) не изменился. Помимо встретившихся нам последовательностей была найдена ещё одна с достаточно удовлетворительным e-value (2e-31).
 Score =  642 bits (324), Expect = 0.0
 Identities = 897/1088 (82%)
 Strand = Plus / Minus

                                                                         
Query: 1     atgaaacggaatgcgaaaactatcatcgcagggatgattgcactggcaatttcacacacc 60
             ||||||||||| |||||||| || |||||||||||  ||||| | ||| | || ||    
Sbjct: 11264 atgaaacggaaagcgaaaacaataatcgcagggattgttgcattagcagtctcgcagggg 11205

                                                                         
Query: 61    gctatggctgacgatattaaagtcgccgttgtcggcgcgatgtccggcccgattgcccag 120
             || ||||| || ||||||||||||||| | ||||| ||||||||||||||| | || || 
Sbjct: 11204 gcaatggcagatgatattaaagtcgccatagtcggggcgatgtccggcccggtagcgcaa 11145

                                                                         
Query: 121   tggggcataatggaatttaacggcgcggagcaggcgattaaagacattaatgccaaaggg 180
             ||||||   ||||||||||||||||||   ||||| ||||||||||| || || ||||| 
Sbjct: 11144 tggggcgatatggaatttaacggcgcgcgccaggccattaaagacatcaacgcgaaaggc 11085

                                                                         
Query: 181   ggaattaagggcgataaactggttggcgtggaatatgacgacgcatgcgacccgaaacaa 240
             || ||||| |||||||| ||||| ||||| || || || || || ||||| || ||||| 
Sbjct: 11084 gggattaaaggcgataagctggtcggcgtagagtacgatgatgcctgcgatccaaaacag 11025

                                                                         
Query: 241   gccgttgcggtcgccaacaaaatcgttaatgacggcattaaatacgttattggtcatctg 300
             || || ||||| ||||||||||||||||| ||||| ||| | ||||||||||||||  ||
Sbjct: 11024 gcggtggcggtggccaacaaaatcgttaacgacggtattcagtacgttattggtcacttg 10965

                                                                         
Query: 301   tgttcttcttctacccagcctgcgtcagacatctatgaagacgaaggtattctaatgatc 360
             |||||||||||||| ||||| || || || ||||||||||| ||||||||||| ||||||
Sbjct: 10964 tgttcttcttctactcagccagcatccgatatctatgaagatgaaggtattctgatgatc 10905

                                                                         
Query: 361   tcgccgggagcgaccgcgccggaactaacccaacgcggttatcaacacattatgcgtact 420
             || ||||| |||||    ||||| || ||||| ||||| |||||  ||||||||||||| 
Sbjct: 10904 tccccgggggcgactaacccggagctgacccagcgcggctatcagtacattatgcgtacc 10845

                                                                         
Query: 421   gccgggctggactcttcccaggggccaacggcggcaaaatacattcttgagacggtgaag 480
             ||||| |||||||| |||||||||||||| || || |||||||| || || |||||||| 
Sbjct: 10844 gccggcctggactcctcccaggggccaacagccgcgaaatacatcctggaaacggtgaaa 10785

                                                                         
Query: 481   ccccagcgcatcgccatcatccacgacaaacaacagtatggcgaagggctggcgcgttcg 540
             || ||||||||||| ||||| ||||| ||||| || || |||||||| |||||||| || 
Sbjct: 10784 ccgcagcgcatcgctatcattcacgataaacagcaatacggcgaaggactggcgcgctcc 10725

                                                                         
Query: 541   gtgcaggacgggctgaaagcggctaacgccaacgtcgtcttcttcgatggtattaccgcc 600
             |||||||| || |||||   ||  || |||||  | ||||| || |||||||||||||| 
Sbjct: 10724 gtgcaggatggcctgaagcagggcaatgccaatattgtcttttttgatggtattaccgct 10665

                                                                         
Query: 601   ggggagaaagatttctccgcgctgatcgcccgcctgaaaaaagaaaacatcgacttcgtt 660
             || || |||||||||||||| ||||| |||||| || ||||||| || |||||||| || 
Sbjct: 10664 ggcgaaaaagatttctccgccctgattgcccgcttgcaaaaagagaatatcgactttgtg 10605

                                                                         
Query: 661   tactacggcggttactacccggaaatggggcagatgctgcgccaggcccgttccgttggc 720
             || |||||||| |||||||||||||||||||||||||| |||||||| ||  |   ||||
Sbjct: 10604 tattacggcggctactacccggaaatggggcagatgctacgccaggcgcgggctaatggc 10545

                                                                         
Query: 721   ctgaaaacccagtttatggggccggaaggtgtgggtaatgcgtcgttgtcgaacattgcc 780
             |||||||| || ||||||||||||||||| || ||||| |||||| |||| || ||||| 
Sbjct: 10544 ctgaaaacgcaatttatggggccggaaggcgtaggtaacgcgtcgctgtccaatattgcg 10485

                                                                         
Query: 781   ggtgatgccgccgaaggcatgttggtcactatgccaaaacgctatgaccaggatccggca 840
             || | ||| || |||||||||||||| || ||||||||||| ||||||||||| ||||| 
Sbjct: 10484 ggcggtgcggcggaaggcatgttggtgacgatgccaaaacgttatgaccaggacccggcg 10425

                                                                         
Query: 841   aaccagggcatcgttgatgcgctgaaagcagacaagaaagatccgtccgggccttatgtc 900
             ||  | |  || || || ||||||||||| ||||||||||||||   ||| || || |||
Sbjct: 10424 aataaagcgattgtcgaagcgctgaaagccgacaagaaagatcccagcggtccgtacgtc 10365

                                                                         
Query: 901   tggatcacctacgcggcggtgcaatctctggcgactgcccttgagcgtaccggcagcgat 960
             |||||||||||||| || || || || |||||||| ||  |   ||||| || |||| ||
Sbjct: 10364 tggatcacctacgccgccgtccagtcactggcgaccgcaatgacgcgtagcgccagccat 10305

                                                                         
Query: 961   gagccgctggcgctggtgaaagatttaaaagctaacggtgcaaacaccgtgattgggccg 1020
             |  |||||||  |||||||||||| | ||||||||||| ||  | ||||| |||||||||
Sbjct: 10304 gctccgctggatctggtgaaagatcttaaagctaacggggctgataccgttattgggccg 10245

                                                                         
Query: 1021  ctgaactgggatgaaaaaggcgatcttaagggatttgattttggtgtgttccagtggcac 1080
             ||||| |||||||||||||||||||||||||||||||| ||||| || ||||||||||||
Sbjct: 10244 ctgaaatgggatgaaaaaggcgatcttaagggatttgaatttggcgtcttccagtggcac 10185

                     
Query: 1081  gccgacgg 1088
             ||||||||
Sbjct: 10184 gccgacgg 10177

Главная страница
Второй семестр
Первый семестр

©Арутюнов Артём

©Photo exclusiely made by myself :)

©Я в контакте