Программы пакета BLAST для работы с нуклеотидными последовательностями

 

      Поиск в неаннотированном геноме генов, кодирующих белки, похожие на заданный, и аналогичный поиск сразу в нескольких геномах

     

      Поиск был осуществлён с помощью программы TBLASTN, так как эта программа ищет нуклеотидные последовательности по заданной аминокислотной последовательности, что и было необходимо.

 

Поиск гомологов GLK_Ecoli

Геном Pseudomonas aeruginosa

Геном Pasteurella multocida

Геном Vibrio cholerae

Характеристика лучшей находки:

 

 

 

    

E-value находки

2e-48

2.6

5.9

 

Координаты выравниваний в записи генома

5032 - 4091 (Комплементарная цепь)

9135 - 8839 (Комплементарная цепь)

7371 - 7481

AC соответствующей записи EMBL

AE004743

AE006183

AE004187

 

Координаты CDS в записи EMBL (если они есть)

3584379 - 3585374 

1511 - 2485

777 - 1322

 

AC UniProt в записи EMBL (если есть)

Q9HZ46

Q9CKY6

Q9KT52

Число находок с Е-value<0,01

1

0

0

Поиск по трём геномам

 

 

 

 E-value

4e-48

 Число находок с Е-value<0,01

1

      Поиск по 3 геномам также проходил с помощью программы TBLASTN. Лучшая находка совпадает с лучшей находкой по геному организма Pseudomonas aeruginosa. Значение E-value при поиске по 3 геномам увеличилось в 2 раза; это объясняется тем, что здесь поиск происходил по базе данных большей в 2 раза (геном организма Pseudomonas aeruginosa 529 sequences; 6,296,083 total letters; 3 генома 1077 sequences; 12,619,654 total letters).

 

      Поиск гомологов с помощью программы BLASTN

                                                            	     Score    E
Sequences producing significant alignments:                          (bits) Value
 
embl|AE004905|AE004905 Pseudomonas aeruginosa PAO1, section 466 ...    34   0.81 
embl|AE004756|AE004756 Pseudomonas aeruginosa PAO1, section 317 ...    34   0.81
embl|AE004755|AE004755 Pseudomonas aeruginosa PAO1, section 316 ...    34   0.81
 
 
 
>embl|AE004905|AE004905 Pseudomonas aeruginosa PAO1, section 466 of
            529 of the complete genome.
          Length = 10822
 
 Score = 34.2 bits (17), Expect = 0.81
 Identities = 17/17 (100%)
 Strand = Plus / Minus
 
                             
Query: 50   ggagcctgcctttccgg 66
            |||||||||||||||||
Sbjct: 7057 ggagcctgcctttccgg 7041
 
 
>embl|AE004756|AE004756 Pseudomonas aeruginosa PAO1, section 317 of
           529 of the complete genome.
          Length = 11039
 
 Score = 34.2 bits (17), Expect = 0.81
 Identities = 17/17 (100%)
 Strand = Plus / Plus
 
                            
Query: 599 tgccaggcgaaggcggt 615
           |||||||||||||||||
Sbjct: 5   tgccaggcgaaggcggt 21
 
 
>embl|AE004755|AE004755 Pseudomonas aeruginosa PAO1, section 316 of 529
             of the complete genome.
          Length = 14759
 
 Score = 34.2 bits (17), Expect = 0.81
 Identities = 17/17 (100%)
 Strand = Plus / Plus
 
                              
Query: 599   tgccaggcgaaggcggt 615
             |||||||||||||||||
Sbjct: 14704 tgccaggcgaaggcggt 14720
 
 
 
   Найдено 3 нуклеотидные последовательности с наилучшим значением E-value 0,81, все 3 из организма Pseudomonas aeruginosa,
идентичность при выравнивании составляет 17/17 (100%).

   Гомолог исследуемого белка не найден, т. к. значение E-value достаточно большое (0,81).

На главную страницу третьего семестра


©Дмитрий