Сравнение Megablast и BLASTN





Для выполнения этого практикума я провел поиск по организму Thermus thermophilus на сайте NCBI и выбрал штаммы HB8 и TTHNAR1 (хромосомы с acc AP008226.1 и LR027517.1 соответственно). Далее я провел выранивание этих последовательностей при помощи Megablast и BLASTN.


На первом рисунке изображен Dot Plot выравнивания при помощи Megablast. Я исходил из предположения, что близкие особи одного видадолжны иметь почти идентичный геном, поэтому выбрал длину слова 256. Благодаря такой длине, на графике почти не видно коротких повторов. Megablast выравниваниет только консервативные участки (из за большой длины слова), поэтому мы видим на графике прерывистую линию.


Так как геном бактерий кольцевой, возникает проблема выбрать нуклеотид, с которго будет начинаться последовательность. Как видно из графика, у штамма TTHNAR1 старт последовательности - это примерно 300-тысячная координата у TB8. Также видно, что кусок длиной 350 тыс нуклеотидов (в начале последовательности HB8) перевернулся у одного из организмов. Линия, показывающая выравнивание, почти всегда направлена вниз. Это означает, что у этих штаммов хранятся разные цепочки ДНК.


На втором рисунке изображен Dot plot, сделанный BLASTN с настройками по умолчанию. Этот алгоритм выравнивает менее похожие последовательности, поэтому линия получиласть менее прерывистая. В данном случае линия прерывается в неконсервативных участках, длина которых не совпадает у двух штаммов. Также на графике видно много отдельных 'точек', которые представляют собой повторы в геноме.





Рис 1. Выравнивание Megablast



Рис 2. Выравнивание BLASTN