Практикум 10

или "карты, деньги...нет, просто карты"

Поиск в нуклеотидных банках по аннотации. Выравнивание геномов

Задание 1. Выбор необходимого генома

Для выполнения данного практикума я решила выбрать Yersinia, — род бактерий из семейства Yersiniaceae, грамотрицательные палочки. Некоторые из иерсиний патогенны для человека, вызывают иерсиниозы. Их природный резервуар — грызуны, иногда и другие млекопитающие. Свой выбор я остановила на двух видах Yersinia, а именно:

Yersinia hibernica strain CFS1934: NZ_CP032487.1 (ось OY на графиках)

Yersinia canariae strain NCTC 14382: NZ_CP043727.1 (ось OX на графиках)

Поиск был произведен в банке "Nucleotides" NCBI с указанием "Chromosome" в графе "Title".

Рис.1. Электронная микрофотография представителя рода Yersinia

Задание 2. Выравнивание и Dot Plot

Выравнивание проводилось с помощью megablast и blastn с параметрами по умолчанию. В случае использования megablast процент покрытия составил 83%, а процент идентичности 89.11%, при использовании blastn значения были 85% и 89.03%, соответственно. Такие значения не удивительны, ведь для выравнивания были выбраны два вида одного и того же рода. Также, полученные значения позволяют предположить, что blastn является более чувствительным, чем megablast(это будет подтверждено впоследствии на картах локального сходства).

В самом начале, для получения карты локального сходства использовался blastn с подключением алгоритма megablast. Получившийся результат можно увидеть ниже:

Рис.2. Карта локального сходства Yersinia hibernica strain CFS1934 и Yersinia canariae strain NCTC 14382, построенная с использованием алгоритмов blastn и megablast

Исходя из полученной карты можно предположить, что произошла серия инверсий, а именно две. После первой изменилась ориентация центрального участка, после второй — частично восстановилась. Также после инверсий произошла транслокация, что опять же, хорошо наблюдается по центральному участку на Dot Plot. Если смотреть по углам карты, то можно заметить произошедшие делеции(или инсерции), на это нам указывает характерный "обрыв" прямых.

Далее использовался только blastn без подключения megablast. Полученный результат можно увидеть ниже:

Рис.3. Карта локального сходства Yersinia hibernica strain CFS1934 и Yersinia canariae strain NCTC 14382, построенная с использованием алгоритма blastn

Видно, что результаты очень похожи(что логично). Однако на данном Dot Plot бросается в глаза "шум" — выявленные blastn участки локального сходства, которые не были замечены megablast. Где-то данные разбросанные "точки" образовали целые столбики — регионы повторов.

Исходя из всего вышеперечисленного, можно сделать вывод о том, что алгоритм blastn и правда чувствительнее megablast.