Онлайн BLAST

Поиск организма по фрагменту нуклеотидной последовательности

С помощью BLASTn было выяснено, какому организму принадлежал фрагмент последовательности. Для этого был употреблен стоящий по умолчанию параметр megablast, который отлично справляется с задачей нахождения в банке близких гомологов (за счет большой длины затравки). В таблице 1 приведены результаты.

Табл. 1. Результаты поиска организма-хозяина
Фрагмент №22
Организм-хозяин Methanothermobacter thermautotrophicus str. Delta
AC записи RefSeq NC_000916.1
Координаты в полном геноме 1145->1444
Кодирует ли? Нет, участок не является кодирующим

Поиск гомолога белка человека в слоне

Для белка bms1_human командой

sw:bms_human -auto

был получен файл с его белковой последовательностью. Далее на сайте ENA был произведен поиск его гомологов в африканском слоне. Результаты параметров лучшей находки представлены в таблице 2.

Табл. 2. Параметры лучшей находки
e-value 0
Длина выравнивания 33 639
Identity 86 %
Координаты в полном геноме 3668->104584
Количество интронов 19

Поиск некодирующих последовательностей программой BLAST

Для выполнения этого задания был выбран ген сериновой тРНК exbB бактерии Gramella forsetii. Последовательность этого гена искалась в бактериях того же порядка Flavobacteriales. Было произведено 3 варианта поиска, результатом было число находок с e-value <0,001: В параметрах было разреншено выводить о 1000 записей для того, чтобы это не влияло на результаты.
Анализируя эти данные, мы не можем не заметить крайне малое число находок с использованием алгоритма megablast. Как уже было сказано ранее, это связано с исключительно длинным словом-"затравкой", что приводит к обнаружению только близких родственником-гомологов. Соответственно, число таких гораздо меньше, чем число всех гомологов данной сериновой тРНК. С другой стороны, повышая до максимума чувствительность blastn, мы не сильно выигрываем, добавляя лишь 6 новых гомологов. Таким образом, можно считать, что параметры по умолчанию являются приемлемыми для решения тривиальных задач (за исключение того, если требуются абсолютно все гомологи).

Сравнение программ BLASTN и MegaBLAST.

Перейдя по приведенным ниже ссылках, мы окажемся на страницах, где можно ознакомиться с распределением по таксонам находок от трех параллельных поисков. Можем заметить, что главным образом, добавление ноых крупных таксонов происходит при переходе от megablasta к blastn, тогда как мелкие таксоны появляются и при дальнейшем увелицении "мощности", то есть при переходе к настраиваемы параметрам blastn. Опять же, это связано со спецификой поиска этих алгоритмов. Кроме того, если алгоритм megablast предлагал лучшее выравнивание из последовательности одного организма, то другими параметрами частенько получали несколько выравниваний из разных частей генома; возможно, это были изначально дуплицированные гены, впоследствии мутировавшие и потерявшие столь близкое сходство со своим паралогом.

© Elizaveta Besedina, FBB 2012
lizaveta@kodomo.fbb.msu.ru