Практикум 10

Были взяты последовательности хромосом из двух сборок архей из рода Methanosphaera:

Обе последовательности были найдены при помощи системы поиска на сайте NCBI.

Вторая последовательность оказалась значительно длиннее первой (2.9 Mb и 1.8 Mb соответственно), и уже хотя бы поэтому можно предположить наличие крупных инделей.

Оба запуска BLAST происходили со значениями парамаетров по умолчанию.

Карта локального сходства, полученная при помощи blastn имеет в целом более чёткие линии, но имеет "шум" из повторов.

Что можно увидеть на карте локального сходства:

Я попыталась уменьшить длину слова до 7, но в таком случае происходит превышение максимального времени, которое может быть отведено на поиск.

Рис 1 Карта локального сходства последовательностей LR698975.1 и CP014213.1, полученная при помощи megablast
Рис 2 Карта локального сходства последовательностей LR698975.1 и CP014213.1, полученная при помощи blastn

Потом я пыталась ограничить участок поиска этими невыровнявшимися участками и всё-таки снизить длину слова до 7, но это ничего не дало. Возможно, этот участок эволюционирует быстрее других участков.

Рис 3 Карта локального сходства последовательностей LR698975.1 и CP014213.1, полученная при помощи blastn при длине слова 7