Карты локального сходства

1. Выбор последовательностей

Для построения карты локального сходства мной были выбраны две последовательности полного однохромосомного генома бактерий из рода Bacillus: B.subtillis и B.anthracis. Bacillus subtillis, или сенная палочка, является спорообразующей грам-положительной бактерией, а также модельным организмом, который редко ассоциирован с различными заболеваниями, в отличие от своего родственника, Bacillus anthracis, который, несмотря на родство и вытекающие из него сходства, является сильным патогеном. В связи с этими отличиями была построена карта локального сходства Dotplot при использовании двух алгоритмов: megablast и BLASTN, а также опции "allign two or more sequences". Для этого из базы данных NCBI, сборного банка "Nucleotides" с помощью запроса
(taxon) AND chromosome[Title]
, где taxon - видовое названее бактерий. В результате для каждой бактерии были получены списки геномных сборок, среди которых были выбраны сборки с параметром принадлежности к RefSeq. Таким образом, для B.subtillis был выбран геном с accession NZ_CP090125.1 и NZ_CP026608.1 для B.anthracis.

2. Dotplot

Каждому алгоритму выравнивания соотвествует свой график Dotplot (см. рис.1 и рис.2).
photo

Рисунок 1.выдача Dotplot при использовании megablast

photo

Рисунок 2.выдача Dotplot при использовании blastn

На данных изображениях видно, что более результативным оказался алгоритм blastn, так как megablast - более быстрое выриавнивание максимально схожих, или практически идентичных последовательностей. На рисунке 1 можно рассмотреть малое количество точек, соответствующих повторам, а также большое количество разрывов и вовсе пустых мест. Рассмотрим результат на рисунке 2. В сравнении с результатом выдачи Dotplot первого алгоритма, в данном случае наблюдается большее количество фрагментов и отдельных точек на карте локального сходства. В левом верхнем углу можно наблюдать практически линейный участок, в котором есть небольшие разрывы, которым, вероятнее всего, соответсвуют пропуски в виде гэпов, что говорит о частичной неконсервативности участка, хоть тот, ввиду своего линейного изображения на карте, является отображением совпадения последовательностей. Справа на изображении видны короткие участки, имеющие противоположное направление. Они могут свидетельствовать о наличии транспозиции (прерывистая и перемещенная короткая линия) и инверсии (противоположное направление). Таким образом, можно сделать вывод, что данные организмы, являющиеся представителями одного рода, нельзя назвать генетически очень схожими, так как в их геномах наблюдаются изменения (перестройки), хоть и имеются некоторые общие фрагменты. Вероятно эти отличия в геномах и определяют различные особенности данных видов, также упомянутые ранее.