Программы пакета BLAST для работы с нуклеотидными последовательностями

Для выполнения этой задачи нам необходима программа, которая делает локальное выравнивание подавемого на вход белка и "виртуально транслированной нуклеотидной последовательности" и по этому выравниванию находит искомый ген.
Этим требованиям отвечает TBLASTN.
Поиск гомологов FABG_ECOLI Геном Pseudomonas aeruginosa (синегнойной палочки)
Характеристика лучшей находки:  
     E-value находки 4e-83
     E-value лучшей находки(в поиске в Pseudomonas aeruginosa) при поиске сразу в трёх геномах. 9e-83
  координаты выравнивания
в записи генома
9428-8691 (section 283)
AC соответствующей записи EMBL AE004722(объединен с AE004091)
  Координаты CDS в записи EMBL (если они есть) данные отсутствуют из-за объединения
  AC UniProt в записи EMBL (если есть) данные отсутствуют из-за объединения
Число находок с Е-value<0,01
43
Число находок с Е-value<0,01 при поиске сразу по трём геномам.
57(из всех организмов)-14=
43
В выравнивании по трем организмам число находок с Е-value<0,01 из Pseudomonas aeruginosa осталось тем же. Е-value несколько стало хуже (порядок тот же) это произошло потому что увеличилось количество генов, по которому производится поиск (возросла вероятность случайной находки). Но лучшей находкой стал ген уже не AE004722 (Pseudomonas aeruginosa PAO1, section 283 of 529 of the complete genome).

Программа BLASTN Лучшей находкой (E-value=4*10-20) стала нуклеотидная последовательность из Vibrio cholerae как и при поиске по трем организмам программой TBLASTN
Значит скорее всего ген VC2021(с координатами: complement(9952..10698) из AE004276(Vibrio cholerae O1 biovar eltor str. N16961 chromosome I, section 184 of 251 of the complete chromosome.) является гомологом гена белка FABG_ECOLI.

Выравнивание лучшей находки выглядит следующим образом:

>embl|AE004276|AE004276 Vibrio cholerae O1 biovar eltor str. N16961
             chromosome I, section 184 of 251 of the complete
             chromosome.
          Length = 14530

 Score = 97.6 bits (49), Expect = 4e-20
 Identities = 217/273 (79%)
 Strand = Plus / Minus

                                                                         
Query: 247   ctggtcaataatgccggtatcactcgtgataacctgttaatgcgaatgaaagatgaagag 306
             ||||| || ||||| ||||||||||| ||||| ||| | ||||| |||||||| ||||||
Sbjct: 10440 ctggtgaacaatgctggtatcactcgcgataatctgctgatgcgcatgaaagaagaagag 10381

                                                                         
Query: 307   tggaacgatattatcgaaaccaacctttcatctgttttccgtctgtcaaaagcggtaatg 366
             |||   || ||||| || ||||| ||  | ||  ||||||||||||| ||||| ||  ||
Sbjct: 10380 tggtcagacattatggagaccaatctgacgtcgattttccgtctgtctaaagccgttttg 10321

                                                                         
Query: 367   cgcgctatgatgaaaaagcgtcatggtcgtattatcactatcggttctgtggttggtacc 426
             || |  ||||||||||| ||||| |||||||| |||| | | || ||||| ||||| || 
Sbjct: 10320 cgtggcatgatgaaaaaacgtcaaggtcgtatcatcaatgttggctctgttgttggcact 10261

                                                                         
Query: 427   atgggaaatggcggtcaggccaactacgctgcggcgaaagcgggcttgatcggcttcagt 486
             ||||| || |  ||||| ||||||||||| || || ||||||||| | || ||||| | |
Sbjct: 10260 atgggtaacgcaggtcaagccaactacgcggcagcaaaagcgggcgtaattggctttact 10201

                                              
Query: 487   aaatcactggcgcgcgaagttgcgtcacgcggt 519
             || ||| ||||||| |||||||| || ||||||
Sbjct: 10200 aagtcaatggcgcgtgaagttgcatcgcgcggt 10168



 Score = 50.1 bits (25), Expect = 8e-06
 Identities = 49/57 (85%)
 Strand = Plus / Minus

                                                                      
Query: 127   caggcgatcagtgattatttaggtgccaacggcaaaggtctgatgttgaatgtgacc 183
             ||||||||||| ||||| || |||| ||||||||||||| ||   ||||||||||||
Sbjct: 10560 caggcgatcagcgattacttgggtgacaacggcaaaggtatggcattgaatgtgacc 10504

В EMBL есть запись о этом белке(часть записи). Ген- VC2021, его координаты - complement(9952..10698),

На главную страницу семестра


©Goryanin Ignat 2005