E-value нахлодки 5е-58. Других гомологов BLAST не нашел.
Команды, использованные при выполнении задания:
1) Так были созданны индексные файлы:
formatdb -i pm_genome.fasta -p F -n pm
2)Так я запустила поиск:
blastall -p tblastn -d pm -i def_ecoli.fasta -e 0.01
Задание 3.Поиск неаннотированных гомологов белка def_Ecoli по трём геномам.
Были созданы индексные файлы для поиска по всем трём геномам сразу (геном бактерии из задания 2, геном холерного вибриона и геном
синегнойной палочки).Далее был запущен TBLASTN по трём геномам.Обнаружилось 5 находок с E-value <0,01.
embl|AE004095|AE004095 Vibrio cholerae O1 biovar eltor str. N169... 247 1e-66
embl|AE006193|AE006193 Pasteurella multocida subsp. multocida st... 216 3e-57
embl|AE004441|AE004441 Pseudomonas aeruginosa PAO1, section 2 of... 190 2e-49
embl|AE004356|AE004356 Vibrio cholerae O1 biovar eltor str. N169... 162 3e-41
embl|AE004542|AE004542 Pseudomonas aeruginosa PAO1, section 103 ... 72 8e-18
Заметим, что E-value предыдущей находки из задания 2 составил 3е-57. Лучший же гомолог теперь имеет AC AE004095, E-value 1е-66 , а сама
находка из другого генома!!!
Задание 4.Поиск гомологов гена белка def-Ecoli в трёх геномах программой BLASTN.
В рабочей директории BLAST находится fasta-файл с геном белка def_Ecoli, который называется def_ecoli_gene.fasta.
Я искала гомологов этого гена в трёх геномах программой BLASTN (параметр –e я задала 0,01).
Нашелся один гомолог из организма Vibrio cholerae с E-value < 0,01. Его AС AE004095, a E-Value cоставляет 2e-05.
BLASTN не должeн подходить для поиска гомологов последовательности( так как он служит
для поиска точных совпадений),
но в данном случае были получены результаты, подтвержденные предыдущим заданием.
Работа с программами поиска Fasta и Megablast.
Задание1.
Цель – сравнить результаты поиска программами fasta34 и tblastn.
Обе программы однозначно нашли один и тот же гомолог(AC AE004095).
Следует заметить, что координаты выравнивания (510-10/14510-15100)
в случае fasta34
отличаются от ранее полученных только потому, что эта программа выравнивает
нуклеотидную последовательность (а не белковую, как tblastn) против нуклеотидного банка.
Задание2.
Цель-обнаружить число минимальных замен таких,чтобы megablast не нашел бы гомолога.
Чтобы сделать наименьшее число замен во фрагменте, заменим, скажем, каждый 28 нуклеотид
(при стандартной длине “слова” в 28 нуклеотидов). Проверка показывает, что megablast действительно не находит такой гомолог исходного гена,
хотя в нем всего лишь 3 нуклеотидные замены. Это объясняется алгоритмом работы программы.
Исходная последовательность.
atagtcaacaaacagtttgcccgcgaggtgatcgagttcgtgctgtacacagatagccag
taggtcatctgcatcaaactggtactcttgaccattgcgat
Последовательность с заменами