Практикум 10. Выравнивание геномов

В данном практикуме я работал с представителями рода Mycobacterium: Mycobacterium tuberculosis H37Rv и Mycobacterium marinum - бактерии, вызывающие туберкулез, которых я выбрал из рода Mycobacterium, ссылаясь на степень родства. Я бластил ближайших по филогенетическому дереву представителей для Mycobacterium tuberculosis H37Rv до тех пор пока не нашел подходящего. [1]

Для выравнивания я использовал алгоритм blastn в режиме для двух последовательностей, а выравнивал последовательности хромосом, которые я нашел в NCBI.

Выравнивание Megablast было сделано при стандартных параметрах, в то время как для blastn запроса я изменил параметр 'word size= 15'. При запросе со стандартной длинной слова blastn долго грузит и по итогу ничего не выдает.Видимо последовательности при таком запросе оказываются слишком похожи и blastn переутомляется. Результаты выравнивания алгоритмами megablast и blastn представленны на Рис1 и Рис2 соответсвенно.

Письма мастера дзен Рис1. Карта локального сходства Mycobacterium tuberculosis и Mycobacterium marinum полученная алгоритмом "megablast"

Письма мастера дзен Рис2. Карта локального сходства Mycobacterium tuberculosis и Mycobacterium marinum полученная алгоритмом "blastn"

Смотря на карту локального сходства немного трудно понять, что она из себя представляет из-за того, что в начале координат (или по близости) не выявлено совпадений при выравнивании. Можно сделать вывод, что точки начала хромосом были выбраны по разному. Это подтверждается и тем, что у обоих организмов не найден ориджин репликации.

Для более понятного представления я немного изменил карту локального сходства (Рис 3), показав что действительным началом является точка с координатами (примерно) (1400k,6.321m) , а конечной точкой - (1400k,1).

Для этого я сместил начало отсчета хромосомы с помощью графического редактора

Письма мастера дзен Рис3. Карта локального сходства Mycobacterium tuberculosis и Mycobacterium marinum полученная алгоритмом "megablast"(отредактированная)

В выдаче Megablast участки довольно хорошо выравнены и особо крупных инеделей не наблюдается. Однако можно заметить, что линии (выравнивания) не сплошные, а прерывыстые, что указывает на наличие инсерций/делеций или мисмэтчей. Некоторые из этих пустот выравниваются при blastn запросе, поэтому это скорее всего мисматчи.

Видно, что прямая цепь выравнена с комплементарной.(главная цепь направлена по диогонали вниз)

Отчетливо видны 2 инверсии на участках 150k- 1,500k и 2,500k- 3,900k. (координаты по оси абсцисс на Рис3)

Запрос blastn проходит при более низкой длинее слова нежели megablast, поэтому в теории должно найтись больше выравненных участков. Так и происходит.

В выдаче blastn появляется множество отдельных точек, что говорит о многочисленных локальных повторах. Наличие столь большого числа повторов объясняется патогенностью выбранных организмов. Для таких организмов свойственно терять большую часть разнообразия генов и дублицировать множество повторов имеющихся генов.[2]

Поэтому при запуске blastn появилось особенно много новых сходств и поэтому выполнить запрост blastn при длинее слова 11 не выходит.

Литература

[1]Pradeep Reddy Marri, John P. Bannantine, Michael L. Paustian, and G. Brian Golding.Lateral gene transfer in Mycobacterium avium subspecies paratuberculosis.doi:10.1139/W06-001

[2]Molecular Biology and Evolution, Volume 38, Issue 4, April 2021, Pages 1570–1579, https://doi.org/10.1093/molbev/msaa323