МГУ

Учебная страница
Жуковой Надежды

Студентки факультета биоинженерии
и биоинформатики МГУ им. Ломоносова

ФББ

ПРАКТИКУМ №8:
Нуклеотидный BLAST.

Задание №1: Определение функции и таксономии нуклеотидной последовательности

Таксономия и функция определялись для нуклеотидной последовательности consens.fasta, полученной в практикуме №6. Для этого использовался
blastn, поскольку неизвестно, кодирует ли что-то данная последовательность, c алгоритмом поиска megablast, оптимизированным для поиска очень
близких гомологов. Параметры запуска BLAST: word size – 16, max target sequences – 100, expected threshold – 0.1, поиск по базе nt (nucleotide
collection). Identity результатов поиска колеблется от 92,6% до 99,74%. Несколько лучших результатов поика представленны ниже, а полную таблицу
с результатами можно ознакомиться по ссылке.

1

Также был проведен аналогичный поиск с алгоритмом blastn. Параметры запуска BLAST: word size – 11, max target sequences – 100, expected
threshold – 0.1, поиск по базе nt (nucleotide collection). Результаты поиса были такими же.
Для аннотации достаточно первых 10 находок, поскольку среди них уже достаточно данных, чтобы предположить, что данная нуклеотидная
последовательность скорее всегоявляется последовательностью 18S рибосомальной РНК плоских червей рода Diphyllobothrium sp. Однако также
можно найти среди находок и других представителей семейства Diphyllobothriidae, например Pyramicocephalus phocarum.

Задание №2: Поиск генов белков в неаннотированной нуклеотидной последовательности

Для определения функции и таксономии последовательности контига был использован blastx, так как он позволяет осуществить поиск белков по
нуклеотидной последовательности. Параметры запуска BLAST: word size – 6, max target sequences – 100, expected threshold – 0.05. При поиске
был исключен таксон, к которому принадлежит организм, из которого получена нуклеотидная последовательность, а именно вид Phytophtora
parasitica. Поиск проводился только среди белков оомицетов. Найденный белок, закодированный в части данной последовательности, вероятно,
является гидролазой, о чем свидетельствуют лучшие находки.

Результаты поиска можно скачать по ссылке.

Задание №3: Интепретация карты локального сходства гомологичных хромосом двух бактерий

Для выполнения задания были взяты бактерии Rickettsia slovaca и Rickettsia helvetica, хромосомы которых были скачены из банка NCBI Genome.
При первом построении карты локального сходства был использован megablast с исходными параметрами запуска.
Результат содержал довольно много шума, поэтому параметры BLAST были немного изменены, а именно, был увеличен word size.
Результат можно наблюдать ниже:

1

На карте можно выделить несколько значимых участка, которые отражают эволюционные отличия между хромосомами выбранных бактерий.
Для начала видно, что хромосомы кольцевые. Также можно заметить несколько небольших инверсий (в районе 380К-400К, 1.28М-1.32М
в геноме Rickettsia helvetica). Наконец, можно отметить, что у Rickettsia slovaca есть точки графика выравнивания по всей оси,
а у Rickettsia helvetica есть разрывы, это может значить что была вставка в хромосому Rickettsia slovaca или делеция из хромосомы
Rickettsia helvetica (очень небольшая в районе 440К и в районе 780К). Также можно отметить, что хромосомы очень похожи друг на
друга (Identity - 97.00%), поэтому отличия весьма незначительны.