Нуклеотидный BLAST

Определение функции и таксономии нуклеотидной последовательности


Консенсусная последовательность

Мы используем алгоритм blastn, так как мы не знаем, есть ли в базе данных такая же последовательность. В отличие от упомянутого алгоритма, megablast ищет максимально похожие последовательности. Поиск с помощью BLAST производился по базе Nucleotide colection, так как неизвестно, аннотирована ли последовательность или нет. Для параметра wordsize было установлено значение 7.

Результат: с результатом можно ознакомиться по ссылке

Функция последовательности: последовательность является участком гена субъединицы I цитохром оксидазы С, так как у всех записей в выдаче e-value равен 0.0

Tаксономия: данная последовательность с высокой вероятностью принадлежит двустворчатому моллюску Modiolus из семейства Mytilidae, надсемейства Mytiloidea. Все записи из выдачи относятся к одному и тому же роду Modiolus.

Поиск генов белков в неаннотированной нуклеотидной последовательности

Для выполнения этого задания был выбран контиг из геномной сборки Rotaria sordida.

В данном случае была использована программа blastx, так как для поиска генов белков необходимо транслировать исходную нуклеотидную последовательность и по неё выравнивать известные последовательности белков. Для поиска была использована база SwissProt, так как в ней все последовательности белков аннотированы.

Распределение находок по запросу

Выдача BLAST доступна по ссылке

Наименьшим значением E-value характеризуются гены SNW domain-containing protein 1, поэтому можно предположить наличие соответствующего гена в выбранном контиге. Выравнивание можно найти по ссылке.

Интепретация карты локального сходства гомологичных хромосом двух бактерий

Для сравнения были выбраны геномы двух представителей клады Фирмикуты Lactobacillus acetotolerans strain LA749 (NZ_CP044496.1) и Lactobacillus acidophilus La-14 ( NC_021181.2).

Таблица локального сходства

Для построения карты локального сходства использовался megablast с параметрами по умолчанию. По дотплоту видно наличие инверсии на большом участке 400 К - 1,600 К. Также имели место делеции (на рисунке их приблизительно 4). Помимо этого можно увидеть присутствие шума.