Для выполнения этой задачи нам необходима программа, которая делает локальное выравнивание подавемого на вход белка и "виртуально транслированной нуклеотидной последовательности" и по этому выравниванию находит искомый ген.
Этим требованиям отвечает TBLASTN.
Поиск гомологов FABG_ECOLI | Геном Pseudomonas aeruginosa (синегнойной палочки) | |
Характеристика лучшей находки: | ||
E-value находки | 4e-83 | |
E-value лучшей находки(в поиске в Pseudomonas aeruginosa) при поиске сразу в трёх геномах. | 9e-83 | |
координаты выравнивания в записи генома |
9428-8691 (section 283) | |
AC соответствующей записи EMBL | AE004722(объединен с AE004091) | |
Координаты CDS в записи EMBL (если они есть) | данные отсутствуют из-за объединения | |
AC UniProt в записи EMBL (если есть) | данные отсутствуют из-за объединения | |
Число находок с Е-value<0,01 |
43 | |
Число находок с Е-value<0,01 при поиске сразу по трём геномам. |
57(из всех организмов)-14= 43 |
Программа BLASTN
Лучшей находкой (E-value=4*10-20) стала нуклеотидная последовательность из Vibrio cholerae как и при поиске по трем организмам программой TBLASTN
Значит скорее всего ген VC2021(с координатами: complement(9952..10698) из AE004276(Vibrio cholerae O1 biovar eltor str. N16961 chromosome I, section 184 of 251 of the complete chromosome.) является гомологом гена белка FABG_ECOLI.
Выравнивание лучшей находки выглядит следующим образом:
>embl|AE004276|AE004276 Vibrio cholerae O1 biovar eltor str. N16961 chromosome I, section 184 of 251 of the complete chromosome. Length = 14530 Score = 97.6 bits (49), Expect = 4e-20 Identities = 217/273 (79%) Strand = Plus / Minus Query: 247 ctggtcaataatgccggtatcactcgtgataacctgttaatgcgaatgaaagatgaagag 306 ||||| || ||||| ||||||||||| ||||| ||| | ||||| |||||||| |||||| Sbjct: 10440 ctggtgaacaatgctggtatcactcgcgataatctgctgatgcgcatgaaagaagaagag 10381 Query: 307 tggaacgatattatcgaaaccaacctttcatctgttttccgtctgtcaaaagcggtaatg 366 ||| || ||||| || ||||| || | || ||||||||||||| ||||| || || Sbjct: 10380 tggtcagacattatggagaccaatctgacgtcgattttccgtctgtctaaagccgttttg 10321 Query: 367 cgcgctatgatgaaaaagcgtcatggtcgtattatcactatcggttctgtggttggtacc 426 || | ||||||||||| ||||| |||||||| |||| | | || ||||| ||||| || Sbjct: 10320 cgtggcatgatgaaaaaacgtcaaggtcgtatcatcaatgttggctctgttgttggcact 10261 Query: 427 atgggaaatggcggtcaggccaactacgctgcggcgaaagcgggcttgatcggcttcagt 486 ||||| || | ||||| ||||||||||| || || ||||||||| | || ||||| | | Sbjct: 10260 atgggtaacgcaggtcaagccaactacgcggcagcaaaagcgggcgtaattggctttact 10201 Query: 487 aaatcactggcgcgcgaagttgcgtcacgcggt 519 || ||| ||||||| |||||||| || |||||| Sbjct: 10200 aagtcaatggcgcgtgaagttgcatcgcgcggt 10168 Score = 50.1 bits (25), Expect = 8e-06 Identities = 49/57 (85%) Strand = Plus / Minus Query: 127 caggcgatcagtgattatttaggtgccaacggcaaaggtctgatgttgaatgtgacc 183 ||||||||||| ||||| || |||| ||||||||||||| || |||||||||||| Sbjct: 10560 caggcgatcagcgattacttgggtgacaacggcaaaggtatggcattgaatgtgacc 10504В EMBL есть запись о этом белке(часть записи). Ген- VC2021, его координаты - complement(9952..10698),
![]() |
На главную страницу семестра |