Практикум 10
Были взяты последовательности хромосом из двух сборок архей из рода Methanosphaera:
- Methanosphaera stadtmanae
(сборка GCF_902384015.1, ID LR698975.1) - Methanosphaera sp. BMS
(сборка GCF_003268005.1, ID CP014213.1)
Обе последовательности были найдены при помощи системы поиска на сайте NCBI.
Вторая последовательность оказалась значительно длиннее первой (2.9 Mb и 1.8 Mb соответственно), и уже хотя бы поэтому можно предположить наличие крупных инделей.
Оба запуска BLAST происходили со значениями парамаетров по умолчанию.
Карта локального сходства, полученная при помощи blastn имеет в целом более чёткие линии, но имеет "шум" из повторов.
Что можно увидеть на карте локального сходства:
- У этих двух последовательностей выбраны разные точки начала последовательности и разные цепи
- Можно видеть инверсию участка длиной примерно 200 Kb
- Трудно говорить что-то про индели, потому что есть участок в геноме Methanosphaera stadtmanae (примерно 800 – 1150 K) и участок генома Methanosphaera sp. (примерно 0 – 1 M), которые практически не выровнялись вовсе.
Я попыталась уменьшить длину слова до 7, но в таком случае происходит превышение максимального времени, которое может быть отведено на поиск.
Потом я пыталась ограничить участок поиска этими невыровнявшимися участками и всё-таки снизить длину слова до 7, но это ничего не дало. Возможно, этот участок эволюционирует быстрее других участков.