Выравнивание геномов

Для дальнейшей работы было решено взять представителей рода Streptomyces. Представители данного рода вырабатывают антибиотики, причём количество различных биологически активных веществ, производимых представителями рода, доходит до 8 000.[1] Последовательности были найдены на сайте геномы NCBI среди референсных полногеномных сборок для рода Streptomyces. Были выбраны виды Streptomyces lincolnensis и Streptomyces alboniger. Первый вид синтезирует антибиотик линкомицин, а второй — антибиотик пуромицин.[2, 3]

Рис. 1
Рис. 1. Карта локального сходства Streptomyces alboniger с Streptomyces lincolnensis, полученная с помощью алгоритма megablast.
Рис. 1
Рис. 2. Карта локального сходства Streptomyces alboniger с Streptomyces lincolnensis, полученная с помощью алгоритма blastn.

Из первой карты локального сходства можно сделать вывод, что у этих двух видов суммарно произошло по крайней мере 6 инверсий. (Не исключено, что больше, просто они совпали друг с другом, и их результат нельзя увидеть на карте локального сходства.) Они имеют следующие примерные координаты начала и конца в геноме Streptomyces lincolnensis:

  • 2,05 Mb – 8,1 Mb
  • 3,55 Mb – 6,25 Mb
  • 3,55 Mb – 4,4 Mb
  • 4,4 Mb – 6,25 Mb
  • 4,7 Mb – 6,25 Mb
  • 4,4 Mb – 4,7 Mb

Интересен тот факт, что координаты этих инверсии находятся в одних и тех же участках, что говорит о склонности ДНК к двуцепочным разрывам в этих местах. Также можно предположить наличие инсерции 5,2 Mb – 5,5 Mb у Streptomyces lincolnensis или соответствующей делеции у Streptomyces alboniger. По координатам 8,9 Mb – 1,8 Mb (помним, что хромосома кольцевая) либо у обоих видов произошла вставка, но разного характера, либо у одного из видов сначала произошла делеция, а потом — втавка. Также все линии являются прерывистыми, что можно было бы интерпретировать, как многочисленные делеции (инсерции), но при рассмотрении второй карты локального сходства можно заметить, что здесь эти линии также присутствуют, но они сплошные, что говорит лишь о большом количестве мисмэтчей в этих участках. Также на этой карте можно увидеть, что «всё выравнивается со всем». Это говорит о многочисленных повторах одинаковых паттернов в обоих геномах.