Практикум 8. Нуклеотидный BLAST

Определение функции и таксономии нуклеотидной последовательности

При расшифровке хроматограммы в практикуме 6 была получена следующая консенсусная последовательность. Чтобы определить ее функцию и таксономическое положение был использован blastn, так как это нуклеотидная последовательность, для которой не известно ничего, чтобы ограничить поиск, и нужно найти похожие на нее последовательности. Кроме того, поиск велся по самой крупной БД nr/nt. Помимо наименьшего значения word size (7), повышающего точность, остальные параметры остались неизменными по сравнению со стандартными.

Выдача blastn

46 лучших находок(E-value = 0.0 и процент идентичности > 90%) относятся к виду Ophiopholis aculeata("хрупкая звезда"). Хотя и требовалось найти "хоть что-то похожее", оно было найдено в основном у определенного вида, а значит она для него характерна. На основании поиска можно сделать вывод, что исследуемая последовательность почти гарантированно является участком гена, кодирующего субъединицу I цитохромоксидазы Ophiopholis aculeata.

Поиск генов белков в неаннотированной нуклеотидной последовательности

Я выбрал контиг из сборки организма Arabidopsis thaliana, рассмотренного в практикуме 7. Определить функции белков, кодируемых генами в контиге, можно с помощью blastx. Для достоверности находок в качестве БД был выбран SwissProt, а для точности word size = 2. Остальные параметры остались без изменений. Судя по выдаче и выравниваниям запроса с лучшими находками, в контиге содержатся экзоны гена, кодирующего бета-глюкуронидазу(Рис. 1), значит и белок, кодируемый контигом, обладает той же функцией.

Рисунок 1. Распределение находок по контигу.

Интепретация карты локального сходства гомологичных хромосом двух бактерий

Для составления карты локального сходства я выбрал хромосомы с complete genome assemblyMycobacterium tuberculosis и Mycobacterium leprae

Рисунок 2. Карта локального сходства M. tuberculosis(снизу) и M. lerpae(слева).

Для получения карты было выбрано большее значение параметр word size = 32, за счет чего исчезло много шума. Видно, что геномы претерпели большие перестроения. В районе полумиллионного нуклеотида M. tuberculosis произошла транслокация. Нуклеотиды 2.3М-2.5М M. lerpae отсутствуют у M. tuberculosis, то есть произошел индель(к тому же с транслокацией двух фланкирующих участков). На двухмиллионном нуклеотиде M. lerpae произошел индель. Массовые транслокации и инверсии произошли с 0.6М по 1.4М M. lerpae

Рисунок 3. Карта локального сходства M. tuberculosis(снизу) и M. lerpae(слева) с построениями.