Поиск организма по фрагменту нуклеотидной последовательности
С помощью BLASTn было выяснено, какому организму принадлежал фрагмент последовательности. Для этого был употреблен стоящий по умолчанию параметр megablast, который отлично справляется с задачей нахождения в банке близких гомологов (за счет большой длины затравки). В таблице 1 приведены результаты.Табл. 1. Результаты поиска организма-хозяина
Фрагмент | №22 |
Организм-хозяин | Methanothermobacter thermautotrophicus str. Delta |
AC записи RefSeq | NC_000916.1 |
Координаты в полном геноме | 1145->1444 |
Кодирует ли? | Нет, участок не является кодирующим |
Поиск гомолога белка человека в слоне
Для белка bms1_human командойsw:bms_human -auto
был получен файл с его белковой последовательностью. Далее на сайте ENA был произведен поиск его гомологов в африканском слоне. Результаты параметров лучшей находки представлены в таблице 2.Табл. 2. Параметры лучшей находки
e-value | 0 |
Длина выравнивания | 33 639 |
Identity | 86 % |
Координаты в полном геноме | 3668->104584 |
Количество интронов | 19 |
Поиск некодирующих последовательностей программой BLAST
Для выполнения этого задания был выбран ген сериновой тРНК exbB бактерии Gramella forsetii. Последовательность этого гена искалась в бактериях того же порядка Flavobacteriales. Было произведено 3 варианта поиска, результатом было число находок с e-value <0,001:- алгоритмом megablast - 49
- алгоритмом blastn с параметрами по умолчанию - 109
- алгоритмом blastn с максимально чувствительными параметрами (длиной слова = 7, match/mismatch = 1/-1) - 115
Анализируя эти данные, мы не можем не заметить крайне малое число находок с использованием алгоритма megablast. Как уже было сказано ранее, это связано с исключительно длинным словом-"затравкой", что приводит к обнаружению только близких родственником-гомологов. Соответственно, число таких гораздо меньше, чем число всех гомологов данной сериновой тРНК. С другой стороны, повышая до максимума чувствительность blastn, мы не сильно выигрываем, добавляя лишь 6 новых гомологов. Таким образом, можно считать, что параметры по умолчанию являются приемлемыми для решения тривиальных задач (за исключение того, если требуются абсолютно все гомологи).