Онлайн BLAST

1. Поиск организма по фрагменту нуклеотидной последовательности

По заданному 300-нуклеотидному фрагменту:fragment.fasta, используя программу megablast, определили, какому организму принадлежит данный фрагмент. Результаты представлены ниже.

Организм AC в RefSeq Координаты фрагмента Кодирующий?
Archaeoglobus fulgidus NC_000917 1145 - 1444 нет

2. Поиск гомолога белка человека в слоне

Для того, чтобы получить полный список белков человека, идентификаторы которых начинаются на букву Е, используем следующую команду EMBOSS:

infoseq sw:E*_human -only -name -desc -out proteins_name.txt

Таким образом, получаем файл proteins_name.txt с полным списком белков. Из списка выберем белок EST1A_HUMAN и получим файл с последовательностью этого белка: est1a_human.fasta

seqret sw:est1a_human -auto

Далее на сайте ENA проводим поиск гомолога этого белка в геноме африканского слона(Loxodonta africana). Описание лучшей находки представлено ниже.

e-value Длина выравнивания identity Координаты найденного гена в геноме слона Кол-во интронов
6E-285 511 97% 5214725 - 5393163 9

3. Поиск некодирующих последовательностей программой BLAST

Определили АС записи EMBL с геномом бактерии Geodermatophilus obscurus: CP001867. Далее получили полную запись EMBL, в которой выбрали тРНК с координатами 341069..341155. Для того, чтобы вырезать этот фрагмент, используем команду:

seqret cp001867.entret trna.txt -sask
Получаем файл trna.txt с последовательностью тРНК, связывающейся с серином. Затем проведем поиск гомологов данной последовательности по всем бактериям, относящимся к порядку Actinomycetales. Поиск проводим тремя разными вариантами:

Результаты поиска представлены ниже.

Алгоритм Число находок с e-value < 0,001
megablast 10
blastn(по умолчанию) 100
blastn(word size=7, match/mismatch = 1/-1) 100

Результаты оказались довольно предсказуемыми, megablast нашел всего 10 гомологов, а blastn в обоих случаях нашел по 100 гомологов. Это объясняется тем, что megablast использует затравки из 28-и нуклеотидов, то есть ищет очень близкие гомологи, а blastn использует затравки из 11-и нуклеотидов.


© Evstafyeva Diana, 2013