Выравнивание геномов
Изначально я хотела взять последовательности хромосом двух разных штаммов Bacillus anthracis. Поиск осуществлялся в базе NCBI Genome по соответствующему таксону, далее устанавливая фильтр "chromosome+".
Всего было найдено 122 последовательностей различных штаммов Bacillus anthracis. Я начала брать хромосомы разных штаммов и запускать blastn и megablast, однако существенной разницы в картах локального сходства не было. Поэтому я решила посмотреть родство всех видов рода Bacillus[1], чтобы взять какой-нибудь близкий к Bacillus anthracis организм.
Таким образом, мной был выбран организм Bacillus weihaiensis. Для запуска BLAST в обоих случаях были взяты референсные геномы, хромосомы "na".
Результаты алгоритмов BLAST выглядели заметно различными:
Из второй карты отчетливо видно, что выравниваются прямая цепь с комплементарной, так как линии на карте идут из левого верхнего угла в правый нижний.
Достаточно хорошо выравниваются участки от 0 до 1500К и от 4000К до конца последовательности Bacillus weihaiensis. Это видно, как на карте megablast, так и для blastn. Однако для megablast участки существенно короче, видимо из-за большей длины слова.
На карте blastn хорошо видна инверсия участка с 2250К по 2500К, а также большое количество точек по всей карте, они означают локальные участки сходства. На карте megablast их значительно меньше в силу большей длины слова.
Ради интереса я хотела посмотреть, изменится ли Dot Plot для blastn при длине слова 7, однако осуществить такой поиск мне не удалось: "Process terminated by SIGXCPU".
Литература
1. Alcaraz LD, Moreno-Hagelsieb G, Eguiarte LE, Souza V, Herrera-Estrella L, Olmedo G. Understanding the evolutionary relationships and major traits of Bacillus through comparative genomics. BMC Genomics. 2010 May 26;11:332. doi: 10.1186/1471-2164-11-332. PMID: 20504335; PMCID: PMC2890564.