Программа BLASTP
Целью занятия было научиться работать с вёб-интерфейсом программы Blastp и научиться искать различные белки по их последовательностям.
Поиск белка по его последовательности
Я провёл на сервере NCBI (
http://www.ncbi.nlm.nih.gov/BLAST/) поиск своего белка по последовательности, попросту взяв её из уже готового
fasta-файла и удалив описание белка с настройками по умолчанию. Мой белок при поиске по базе данных
swissprot (
P37028B) был выдан первым, со
score 530,
E-value – 2e-150. Когда я повторил поиск по БД pdb, первым вышел он же, точнее, двухангстремная модель его B-цепи. Код модели –
1N2Z,
score – 490 бита,
E-value - 1e-139, начало выравнивания по исходной последовательности – 22, по данной модели – 1, конец – 266 и 245 соответственно. Процент совпадений – 100%. Разница в E-Value естественно, определяется различием состава этих баз данных. Очевидно, что мой белок присутствует в этих базах данных и они годны хотя бы на то, что бы найти его по в точности совпадающей последовательности.
Поиск белка по его гомологу
Поиск в swissprot по последовательности белка BTUF_PHOLL, гомолога моего BTUF тут же обнаружил консервативный домен BTUF (что вполне естественно). BTUF_ECOLI вышел в результирующей подборке пятым, score – 281, E-value – 2e-75, процент совпадений – 51%, у исходной последовательности и моего белка начало выравнивания – 27 и 22, конец – 271 и 263 соответственно.
Первым по порядку был именно тот белок, чью последовательность я задал. Все результыты очевидны и вполне ожидаемы, ничего интересного…
Поиск белка фрагментам его последовательности
Аналогичный поиск был произведён по
thirdprot.fasta… В этот раз результаты были интереснее – например, почему-то наложились два домена btuf, вполне ожидаемо выровненные к фрагментам моего белка, из которых была собрана эта последовательность (Рис 1.).
В результате мой белок был вторым, score – 80,1, E value – 1e-15, не скажу, что могу особенно осмысленно проанализировать эти результаты…
А странное выравнивание с доменом, оказывается, чисто случайно – вообще процент совпадения очень низкий (17,6%, 14,3%), так что никакого интереса эти выравнивания не представляют.
Рисунок 1. Поиск в Blastp.
Разные пользовательские интерфейсы BLAST
Интерфейс EBI функционально аналогичен предыдущему, но я предпочёл бы именно его – всё как-то внятнее и удобнее. Результаты поиска другие; вряд ли имеет смысл их здесь приводить.
Является ли BLAST инструментом для поиска ортологов?
Я произвёл поиск по базе данных
Swiss-Prot с помощью
BLASTP репрессора рибозного оперона
RbsR из
Bacillus subtilis. Результат поиска в виде имён найденных последовательностей хранится в файле
ortolog.txt, и он наглядно показывает, что
BLASTP является достаточно хорошим инструментом для поиска ортологов - 2 первых найденных последовательности после собственно
RBSR_BACSU начинаются со слова
RBSR.