Весь поиск я осуществляла в банке "Nucleotides" на NCBI.Получалось много красивых графиков Dot Plot для различных бактерий,
но при использовании blastn после blastn с функцией megablast для них просто появлялось больше шума,
кардинальные изменения не были замечены. Спустя примерно 10 попыток мне удалось найти что-то более подходящее под условия задания.
С помощью запроса: "((("Streptococcus"[Organism])) AND "chromosome"[Title]) AND "genome"[Title]" мне удалось найти
1996 геномов, но я уменьшила выдачу с помощью выбора последовательностей только из RefSeq до 834 штук. В качестве матрицы был
выбран полный хромосомный геном Streptococcus suis strain CZ130302 (NZ_CP024974), 2538894 пар оснований, а на
него выравнивался полный хромосомный Streptococcus gallolyticus subsp. gallolyticus DSM 16831 (NZ_CP018822),
2492900 пар оснований, то есть взяты были разные виды, иначе ничего интересного не было. Настройки программ я не меняла.
Для начала охарактеризую первый график: сложно сказать что-то конкретное по нему, так как сходств мало, неконсервативные
участки при использовании данного метода занимают большую чать выравнивания. Консервативные участки выглядят в данном машстабе как точки, но
общую тенденцию можно заметить. Например, участки 1, 2, 4 состоят из нескольких таких точек, что мы можем понять угол наклона
этого условного вектора. Сиреневым отмечена линия тренда сходства двух прямых цепей, а розовым - линия тренда инвертированных
участков, что интересно, поворотов генов достаточно много.
Теперь перейдем к сравнению первого и второго выравнивания. При подключении более точной программы, удалось выявить дополнительные
сходства двух последовательностей, и теперь мы можем заметить достаточно много скоплений точек, выглядящих как векторы:
например, участки 1, 2, 4 остались почти без изменений, но появились новые: 5, 6, 7, 8, 9.
Геном у этих бактерий кольцевой, исследователи сделали записи в базе данных, начинающиеся с одного и того же места в хромосоме.
Что интересно, примерно половина, которая как раз оказалась на разных концах файла имеет больше сходств, чем вторая, находящаяся в
середине графика. Однако и там я нашла примерное сходство: участок 10 достаточно нечеткий, но угол наклона разглядеть можно. Он состоит
из инвертированных у одной из бактерий участков, которые еще и претерпели транспозицию.
В районе 4 можно заметить транспозицию двух верхних голубых областей, а 5 и 7 зоны соответствуют явлению транспозиции с
неконсервативными участками: мы их не видим, но по какой-то причине консервативные участки параллельно перенеслись относительно линии
тренда. В зоне 6 имеется небольшой индель, так как два скопления точек находятся по разные стороны розовой линии. А на участке
9 индели не видны. Между двумя участками, выделенными фиолетовым в начале последовательностей, виден достаточно большой неконсервативный
участок, имеющий индель.