Главная страница второго семестра

Программы пакета BLAST для работы с нуклеотидными последовательностями

Поиск генов, кодирующих похожие на заданный белки, в неаннотированном геноме

В неаннотированом геноме организма Pasteurella multocida проводился поиск генов, кодирующих белки, похожие на aroG_Ecoli. Затем поиск проводился сразу в трех геномах: Pasteurella multocida, Xanthomonas campestris и Salmonella typhimurium. Результаты поиска описаны таблицей.
Поиск гомологов aroG_Ecoli Геном Xanthomonas campestris
Характеристика лучшей находки:  
  E-value находки e-127
  координаты выравнивания
в записи генома
3368-4399
AC соответствующей записи EMBL AE012479
  Координаты CDS в записи EMBL (если они есть) 3353..4426
  AC UniProt в записи EMBL (если есть) Q8P4W9
Число находок с Е-value<0,01
1
E-value лучшей находки при сравнении 3 геномов 0.0 (в организме Salmonella typhimurium)
Число находок с E-value<0,01 при поиске по 3 геномам 6

Лучшая находка по геному Xanthomonas campestris кодирует белок, который является гомологом белка aroG_ecoli, его координаты в геноме этого организма 3353..4426, и ген называется aroG. => Результат поиска положительный :).

При поиске по трем геномам результат отличается от первого, лучшей находкой является область, кодирующая гомологичный белок в организме Salmonella typhimurium. Принципиально результат не отличается, в геноме Xanthomonas campestris найден тот же ген, при выравнивании с таким же значением E-value.

Для поиска использовались команды:

    • formatdb -i 1.fasta -p f -n 1
    • formatdb -i 2.fasta -p f -n 2
    • formatdb -i 3.fasta -p f -n 3
    • blastall -p tblastn -d 2 -i aroG_ecoli.fasta -o first_res
    • genpath=/home/export/samba/public/tmp
    • genomes="$genpath/st_genome.fasta $genpath/xc_genome.fasta $genpath/pm_genome.fasta"
    • formatdb -i "$genomes" -p F -n 123

Поиск гомологов с помощью программы BLASTN

При поиске гомологов гена белка aroG_ECOLI в геномах организмов Salmonella typhimurium, Xanthomonas campestris и Pasteurella multocida программой BLASTN E-value лучшей находки составил 0.0 в организме сальмонеллы, что не отличается от поиска с помощью TBLASTN. При изучении этой области генома сальмонеллы, было выяснено, что ген кодирует как раз белок aroG в данном организме.


>AE008731 AE006468 |AE008731| Salmonella typhimurium LT2, section 39
            of 220 of the complete genome.
          Length = 23049

 Score =  846 bits (427), Expect = 0.0
 Identities = 1026/1223 (83%), Gaps = 2/1223 (0%)
 Strand = Plus / Plus

                                                                        
Query: 292  aacgcagcagagaatcttgaaataattaacaaacaaaggagttacagttagaaattgtag 351
            ||||||||||||||||||| ||||||| | ||||| ||  |||||||||| ||| |||||
Sbjct: 4863 aacgcagcagagaatcttgcaataattcataaacagagtggttacagttaaaaagtgtag 4922

                                                                        
Query: 352  gagagatctcgtttttcgcgacaatctggcgtttttcttgct-aattctaggattaatcc 410
               ||||| | |||||||| ||| |   |||||||| || || ||||| ||||||| |||
Sbjct: 4923 attagatcccatttttcgctacatttgtgcgttttt-ttcctgaattccaggattattcc 4981

                                                                        
Query: 411  gttcatagtgtaaaaccccgtttacacattctgacggaagatatagattggaagtattgc 470
            ||||| ||||||||| |||||||||||  | | |  ||||| |||||||||| | |||||
Sbjct: 4982 gttcaaagtgtaaaagcccgtttacactatttaattgaagagatagattggagggattgc 5041

                                                                        
Query: 471  attcactaagataagtatggcaacactggaacagacatgaattatcagaacgacgattta 530
            ||||| |  |||||||| ||||||||||||| | ||||||||||||||||||||||||||
Sbjct: 5042 attcattgggataagtacggcaacactggaataaacatgaattatcagaacgacgattta 5101

                                                                        
Query: 531  cgcatcaaagaaatcaaagagttacttcctcctgtcgcattgctggaaaaattccccgct 590
            ||||| ||||||||||| |||||| | ||||| |||||  |||||||||| || ||||| 
Sbjct: 5102 cgcattaaagaaatcaacgagttattacctccggtcgcgctgctggaaaagtttcccgcc 5161

                                                                        
Query: 591  actgaaaatgccgcgaatacggttgcccatgcccgaaaagcgatccataagatcctgaaa 650
            || |||||||| || ||||| ||||| || || || ||||| |||||||| || || |||
Sbjct: 5162 acggaaaatgcagcaaataccgttgctcacgcgcgcaaagccatccataaaattctcaaa 5221

                                                                        
Query: 651  ggtaatgatgatcgcctgttggttgtgattggcccatgctcaattcatgatcctgtcgcg 710
            || ||||| ||||| ||| |||| ||||| || || || |||||||||||||| |  |||
Sbjct: 5222 ggcaatgacgatcgtctgctggtggtgatcggtccttgttcaattcatgatccggcagcg 5281

                                                                        
Query: 711  gcaaaagagtatgccactcgcttgctggcgctgcgtgaagagctgaaagatgagctggaa 770
            || |||||||||||| | || ||||||||||| || || |||||  |||  ||||| |||
Sbjct: 5282 gcgaaagagtatgccgcccgtttgctggcgctacgcgatgagcttcaaggcgagcttgaa 5341

                                                                        
Query: 771  atcgtaatgcgcgtctattttgaaaagccgcgtaccacggtgggctggaaagggctgatt 830
            || || ||||||||||||||||| || ||||||||||| || ||||||||||||||||||
Sbjct: 5342 attgtcatgcgcgtctattttgagaaaccgcgtaccaccgtcggctggaaagggctgatt 5401

                                                                        
Query: 831  aacgatccgcatatggataatagcttccagatcaacgacggtctgcgtatagcccgtaaa 890
            ||||||||||| |||||||| ||||||||||| ||||||||||||||||| || || |||
Sbjct: 5402 aacgatccgcacatggataacagcttccagattaacgacggtctgcgtattgcgcgcaaa 5461

                                                                        
Query: 891  ttgctgcttgatattaacgacagcggtctgccagcggcaggtgagtttctcgatatgatc 950
             ||||||| ||||||||||||||||| ||||| || || || || || ||||||||||||
Sbjct: 5462 ctgctgctggatattaacgacagcggcctgcctgccgccggcgaattcctcgatatgatc 5521

                                                                        
Query: 951  accccacaatatctcgctgacctgatgagctggggcgcaattggcgcacgtaccaccgaa 1010
            || || |||||||| || || ||||||||||||||||| |||||||| || || || |||
Sbjct: 5522 acgccgcaatatctggccgatctgatgagctggggcgccattggcgcgcggactactgaa 5581

                                                                        
Query: 1011 tcgcaggtgcaccgcgaactggcatcagggctttcttgtccggtcggcttcaaaaatggc 1070
            || ||||| || |||||| |||| || || || |||||||||||||| || |||||||| 
Sbjct: 5582 tcccaggttcatcgcgaattggcgtctggcctctcttgtccggtcggttttaaaaatggt 5641

                                                                        
Query: 1071 accgacggtacgattaaagtggctatcgatgccattaatgccgccggtgcgccgcactgc 1130
            || || || ||||||||||| || || || ||||| || |||||||| |||||||| |||
Sbjct: 5642 actgatggcacgattaaagtcgccattgacgccatcaacgccgccggcgcgccgcattgc 5701

                                                                        
Query: 1131 ttcctgtccgtaacgaaatgggggcattcggcgattgtgaataccagcggtaacggcgat 1190
            ||||| ||||| || |||||||| |||||||||||||||||||||||||| |||||||| 
Sbjct: 5702 ttcctctccgtcactaaatggggtcattcggcgattgtgaataccagcggcaacggcgac 5761

                                                                        
Query: 1191 tgccatatcattctgcgcggcggtaaagagcctaactacagcgcgaagcacgttgctgaa 1250
            |||||||||||||||||||||||||||| ||| ||||| |||||| |||| |||||||| 
Sbjct: 5762 tgccatatcattctgcgcggcggtaaagcgccaaactatagcgcgcagcatgttgctgag 5821

                                                                        
Query: 1251 gtgaaagaagggctgaacaaagcaggcctgccagcacaggtgatgatcgatttcagccat 1310
            ||||||||||| || | |||||| || ||| |  | ||||| ||||||||||||||||||
Sbjct: 5822 gtgaaagaaggcctcaccaaagcgggactgacgccgcaggtcatgatcgatttcagccat 5881

                                                                        
Query: 1311 gctaactcgtccaaacaattcaaaaagcagatggatgtttgtgctgacgtttgccagcag 1370
            || ||||| |  || |||||  ||||||||||||| ||||| || || || |||||||||
Sbjct: 5882 gccaactcctgtaagcaatttcaaaagcagatggaggtttgcgccgatgtctgccagcag 5941

                                                                        
Query: 1371 attgccggtggcgaaaaggccattattggcgtgatggtggaaagccatctggtggaaggc 1430
            || || || || ||||| || ||||||||||||||||| || || |||||||| ||||| 
Sbjct: 5942 atagcgggcggtgaaaaagcgattattggcgtgatggtagagagtcatctggtagaagga 6001

                                                                        
Query: 1431 aatcagagcctcgagagcggggagccgctggcctacggtaagagcatcaccgatgcctgc 1490
            || ||||| || || |||||  |||||||| |||||||||| ||||| || || ||||| 
Sbjct: 6002 aaccagagtctggaaagcggtcagccgctgacctacggtaaaagcattactgacgcctgt 6061

                                   
Query: 1491 atcggctgggaagataccgatgc 1513
            || ||||||||||||||||||||
Sbjct: 6062 attggctgggaagataccgatgc 6084


©Надя Шашина