Для выполнения задания выбраны полные последовательности хромосом Shewanella glacialimarina TZS-4 (NZ_CP041216.1) и Shewanella denitrificans OS217 (NC_007954.1).
Они были найдены в NCBI Genomes с помощью расширенного поиска: (Shewanella[Organism]) AND "complete"[Status].
Рассмотрим результат выдачи двух алгоритмов (blastn и megablast) с настройками по умолчанию. Длины слов 11 и 28 пар оснований соответственно.
По оси X - Shewanella glacialimarina TZS-4; по оси Y - Shewanella denitrificans OS217 (NC_007954.1).
Алгоритм megablast создан для поиска последовательностей с большим сходством. Поэтому неудивительно, что при сравнении одной и той же пары последовательностей друг с другом с помощью двух разных алгоритмов megablast выдаёт гораздо меньше выравниваний, чем blastn.
"Шум", выданный blastn, свидетельствует о том, что алгоритм обнаружил много мелких участков сходства, не замеченных megablast. Среди них можно заметить (например, в районах 1500M и 3500М по оси Х) участки, образующие "столбики" - регионы повторов.