Онлайн BLAST
megablast
Был проведен поиск по заданному 300-нуклеотидному фрагменту ДНК с помощью нуклотидного blast, а именно megablast. Оказалось, что это кодирующий участок генома бактерии Haloquadratum walsbyi, данные о нем приведены в таблице ниже.
Организм |
AC в Refseq |
Координаты в последовательности |
Кодирующий |
Кодируемый белок |
Haloquadratum walsbyi |
NC_008212.1. |
|
да |
ДНК-репликативный белок ORC1-типа (cdc6-подобный белок контроля деления) |
Этот фрагмент кодирует белок, отвечающий за контроль клеточного деления и участвующий в репликации ДНК.
ENA
Чтобы получить список белков человека, идентификаторы которых в SwissProt начинаются с "M", была использована команда
infoseq sw:m*_human -only -name -desc -out file_name.txt
Для дальнейшей работы был выбран человеческий белок MVP (Major vault protein - главный белок сводов, связанный с легочной резистентностью к ифекции). Для получения его полной последовательности использовалась команда:
seqret sw:mvp_human -auto
Затем по этой последовательности был проведен поиск гомологов у африканского слона (Loxodonta africana). Гомолог был найден, информация о нем приведена в таблице.
e-value |
Длина выравнивания |
Identity |
Координаты в геноме слона |
Количество интронов в гене |
1E-274 |
524 |
92% |
11201968-11321512 |
2 |
Поиск некодирующих последовательностей
С помощью системы SRS был определен AC записи в EMBL, содержащей полную последовательность генома бактерии Janthinobacterium sp.. Затем была получена сама запись с помощью команды:
entret embl:amwd01000001 -auto
Затем из этой записи была выбрана последовательность, кодирующая одну тРНК (ее координаты: 39717..39792), она была вырезана из генома с помощью команды:
seqret amwd01000001.entret trna.txt -sask
По полученной последовательности был проведен поиск в порядке Burkholderiales, к которому относится данная бактерия. Это было сделано тремя способами:
- Алгоритмом megablast
- Алгоритмом blastn с параметрами по умолчанию
- Алгоритмом blastn с длиной слова = 7, match/mismatch = 1/-1
Результаты поиска приведены в таблице.
Алгоритм |
megablast |
blastn (по умолчанию) |
blastn (7, 1/-1) |
Количество хитов с e-value<0,001 |
97 |
133 |
849 |
Подобные результаты говорят о том, что все работает, как надо. Megablast предназначен для поиска только очень похожих последовательносте, поэтому дает меньше хитов по сравнению с blastn, который более чувствителен. Естественно, чем чувствительнее параметры blastn, тем больше хитов он дает.
© Марк Мееросн, 2013
Последнее обновление: 23.11.2013