Сравнение геномов бактерий с помощью Dot Plot

Весь поиск я осуществляла в банке "Nucleotides" на NCBI.Получалось много красивых графиков Dot Plot для различных бактерий, но при использовании blastn после blastn с функцией megablast для них просто появлялось больше шума, кардинальные изменения не были замечены. Спустя примерно 10 попыток мне удалось найти что-то более подходящее под условия задания.
С помощью запроса: "((("Streptococcus"[Organism])) AND "chromosome"[Title]) AND "genome"[Title]" мне удалось найти 1996 геномов, но я уменьшила выдачу с помощью выбора последовательностей только из RefSeq до 834 штук. В качестве матрицы был выбран полный хромосомный геном Streptococcus suis strain CZ130302 (NZ_CP024974), 2538894 пар оснований, а на него выравнивался полный хромосомный Streptococcus gallolyticus subsp. gallolyticus DSM 16831 (NZ_CP018822), 2492900 пар оснований, то есть взяты были разные виды, иначе ничего интересного не было. Настройки программ я не меняла.
Много точек с помощью blastn с функцией megablast.
Рис 1. Dot Plot с помощью blastn с функцией megablast.
Нечто более оформленное с помощью просто blastn.
Рис 2. Dot Plot с помощью просто blastn.
Для начала охарактеризую первый график: сложно сказать что-то конкретное по нему, так как сходств мало, неконсервативные участки при использовании данного метода занимают большую чать выравнивания. Консервативные участки выглядят в данном машстабе как точки, но общую тенденцию можно заметить. Например, участки 1, 2, 4 состоят из нескольких таких точек, что мы можем понять угол наклона этого условного вектора. Сиреневым отмечена линия тренда сходства двух прямых цепей, а розовым - линия тренда инвертированных участков, что интересно, поворотов генов достаточно много.
Теперь перейдем к сравнению первого и второго выравнивания. При подключении более точной программы, удалось выявить дополнительные сходства двух последовательностей, и теперь мы можем заметить достаточно много скоплений точек, выглядящих как векторы: например, участки 1, 2, 4 остались почти без изменений, но появились новые: 5, 6, 7, 8, 9.
Геном у этих бактерий кольцевой, исследователи сделали записи в базе данных, начинающиеся с одного и того же места в хромосоме. Что интересно, примерно половина, которая как раз оказалась на разных концах файла имеет больше сходств, чем вторая, находящаяся в середине графика. Однако и там я нашла примерное сходство: участок 10 достаточно нечеткий, но угол наклона разглядеть можно. Он состоит из инвертированных у одной из бактерий участков, которые еще и претерпели транспозицию.
В районе 4 можно заметить транспозицию двух верхних голубых областей, а 5 и 7 зоны соответствуют явлению транспозиции с неконсервативными участками: мы их не видим, но по какой-то причине консервативные участки параллельно перенеслись относительно линии тренда. В зоне 6 имеется небольшой индель, так как два скопления точек находятся по разные стороны розовой линии. А на участке 9 индели не видны. Между двумя участками, выделенными фиолетовым в начале последовательностей, виден достаточно большой неконсервативный участок, имеющий индель.