Мой выбор пал на энтеровирус человека. Для анализа были взяты энтеровирусы A (Human enterovirus A) и D (Human enterovirus D).
Запрос я делала на сайте NCBI. Исходный запрос был сформулирован так:
(Enterovirus [Organism]) AND genome[Title]
Как видно из dot plot, megablast выравнял только начальные участки последовательностей, в отличие от blastn.
Blastn выровнял последовательности по всей длине с большими гэпами. Вероятно это связано с тем, что megablast ищет "точь-в-точь" такую же последовательность,
а blastn — гомологичную, т.е. алгоритм менее строгий. В megablast используются слова большей длины, штрафы за гэпы линейные и слова берутся через некоторые промежутки,
в отличие от blastn (штрафы афинные, берутся все слова запроса).
Какие тут могли быть геномные перестройки? Мы можем наблюдать достаточно протяженные участки гомологии у этих двух видов. В участках где линия прерывается располагаются негомологичные последовательности.