Выравнивание геномов

Бактерии из рода Magnetospirillum имеют мембранные пузырьки с оксидами железа, позволящие им реагировать на магнитные поля. В последнее время эти бактерии становятся объектами различных исследований, направленных на направленную терапию раковых опухолей. Поэтому было бы интересно сравнить геномы двух представителей данного рода. Был сделан запрос на сайте NCBI Genomes и выбрано две бактерии из этого рода: Magnetospirillum magneticum и Magnetospirillum gryphiswaldense. Сравним карты локального сходства, полученные Megablast и Blastn.

Рис.1 Magnetospirillum magneticum [1]












Карты локального сходства для этих бактерий заметно отличаются. Карта, полученная Blastn, более "шумная": на ней видно гораздо большее число повторов. Такое может происходить, когда мы сравниваем длинные и похожие последовательности.

Рис.2 Карта локального сходства, полученная Megablast
Рис.3 Карта локального сходства, полученная Blastn

Несмотря на то, что мы сравнивали последовательности 2 видов одного рода, ни Megablast, ни Blastn не выявили больших совпадающих участков. Можно выделить его предположительное направление (Рис. 4). Скорее всего, это говорит не о крупной геномной перестройке, а о том, что последовательности геномов были положены в банк в разных направлениях.

Большие размеры геномов этих бактерий затрудняют анализ карт локального сходства. Поэтому с помощью программы seqret из пакета EMBOSS получим участки последовательностей: первые миллион нуклеотидов генома Magnetospirillum magneticum и последние два миллиона нуклеотидов генома Magnetospirillum gryphiswaldense. Аналогично получим карту локального сходства с помощью Megablast (получено именно с помощью Megablast, а не Blastn, чтобы уменьшить количество наблюдаемых точек) (Рис. 5). Направление маленьких повторов (выделены жёлтым) подтвержает совпадение начала одной последовательности с концом другой. Также заметно несколько инвертированных повторов (выделены зелёным).

Рис.4 Карта локального сходства, полученная Megablast. Оранжевым выделено предположительное направление сходства последовательностей
Рис.5 Карта локального сходства, полученная Megablast, для выбранного участка

Если в Megablast изменить уменьшить параметр "wordsize" до 16 (по умолчанию 28), то карта локального сходства будет очень похожа на результат Blastn с параметрами по умолчанию (Рис. 6). Однако уменьшание такого параметра для Blastn приводит к тому, что не будет найдено значительного сходства между последовательностями даже при изменении других параметров (за совпадение/несовпадение, штрафов за гэп и его продление).

Рис.6 Карта локального сходства, полученная Megablast с изменёнными парметрами