Практикум 10


Выбор последовательностей

Мой выбор пал на энтеровирус человека. Для анализа были взяты энтеровирусы A (Human enterovirus A) и D (Human enterovirus D).
Запрос я делала на сайте NCBI. Исходный запрос был сформулирован так:
(Enterovirus [Organism]) AND genome[Title]

Результаты выравнивания

megablast Результат алгоритма megablast
blastn Результат алгоритма blastn

Как видно из dot plot, megablast выравнял только начальные участки последовательностей, в отличие от blastn. Blastn выровнял последовательности по всей длине с большими гэпами. Вероятно это связано с тем, что megablast ищет "точь-в-точь" такую же последовательность, а blastn — гомологичную, т.е. алгоритм менее строгий. В megablast используются слова большей длины, штрафы за гэпы линейные и слова берутся через некоторые промежутки, в отличие от blastn (штрафы афинные, берутся все слова запроса).
Какие тут могли быть геномные перестройки? Мы можем наблюдать достаточно протяженные участки гомологии у этих двух видов. В участках где линия прерывается располагаются негомологичные последовательности.