Практикум 10. Выравнивание геномов
В данном практикуме я работал с представителями рода Mycobacterium: Mycobacterium tuberculosis H37Rv и Mycobacterium marinum - бактерии, вызывающие туберкулез, которых я выбрал из рода Mycobacterium, ссылаясь на степень родства. Я бластил ближайших по филогенетическому дереву представителей для Mycobacterium tuberculosis H37Rv до тех пор пока не нашел подходящего. [1]
Для выравнивания я использовал алгоритм blastn в режиме для двух последовательностей, а выравнивал последовательности хромосом, которые я нашел в NCBI.
Выравнивание Megablast было сделано при стандартных параметрах, в то время как для blastn запроса я изменил параметр 'word size= 15'. При запросе со стандартной длинной слова blastn долго грузит и по итогу ничего не выдает.Видимо последовательности при таком запросе оказываются слишком похожи и blastn переутомляется. Результаты выравнивания алгоритмами megablast и blastn представленны на Рис1 и Рис2 соответсвенно.


Смотря на карту локального сходства немного трудно понять, что она из себя представляет из-за того, что в начале координат (или по близости) не выявлено совпадений при выравнивании. Можно сделать вывод, что точки начала хромосом были выбраны по разному. Это подтверждается и тем, что у обоих организмов не найден ориджин репликации.
Для более понятного представления я немного изменил карту локального сходства (Рис 3), показав что действительным началом является точка с координатами (примерно) (1400k,6.321m) , а конечной точкой - (1400k,1).
Для этого я сместил начало отсчета хромосомы с помощью графического редактора

В выдаче Megablast участки довольно хорошо выравнены и особо крупных инеделей не наблюдается. Однако можно заметить, что линии (выравнивания) не сплошные, а прерывыстые, что указывает на наличие инсерций/делеций или мисмэтчей. Некоторые из этих пустот выравниваются при blastn запросе, поэтому это скорее всего мисматчи.
Видно, что прямая цепь выравнена с комплементарной.(главная цепь направлена по диогонали вниз)
Отчетливо видны 2 инверсии на участках 150k- 1,500k и 2,500k- 3,900k. (координаты по оси абсцисс на Рис3)
Запрос blastn проходит при более низкой длинее слова нежели megablast, поэтому в теории должно найтись больше выравненных участков. Так и происходит.
В выдаче blastn появляется множество отдельных точек, что говорит о многочисленных локальных повторах. Наличие столь большого числа повторов объясняется патогенностью выбранных организмов. Для таких организмов свойственно терять большую часть разнообразия генов и дублицировать множество повторов имеющихся генов.[2]
Поэтому при запуске blastn появилось особенно много новых сходств и поэтому выполнить запрост blastn при длинее слова 11 не выходит.
Литература
[1]Pradeep Reddy Marri, John P. Bannantine, Michael L. Paustian, and G. Brian Golding.Lateral gene transfer in Mycobacterium avium subspecies paratuberculosis.doi:10.1139/W06-001
[2]Molecular Biology and Evolution, Volume 38, Issue 4, April 2021, Pages 1570–1579, https://doi.org/10.1093/molbev/msaa323