Занятие 6. Программа BLASTP

Ваша рабочая директория — H:\Term2\Practice6.

При выполнении первых двух упражнений пользуйтесь web-интерфейсом к BLASTP на сервере NCBI: http://www.ncbi.nlm.nih.gov/blast/, далее в разделе Basic BLAST переходите по гиперссылке "protein blast". Не забывайте указывать нужный банк для поиска!

  1. Поиск белка по его гомологу
    1. Подайте на вход программе BLASTP последовательность гомолога своего белка. Проведите поиск своей в банке swissprot (внимание: для этого надо изменить значение параметра database, по умолчанию стоит банк "nr"). Чтобы получить результат, надо нажать кнопку BLAST и подождать одну-две минуты.

      В выдаче программы отыщите: 1) поданный на вход белок; 2) ваш белок (из E.coli) и занесите в протокол их порядковые номера в выдаче, Score, E-value.

      Внимание: на сайте NCBI банк Swiss-Prot подвергнут "кластеризации": записи с одинаковой последовательностью (часто таковыми являются, например, белки из разных штаммов E.coli) объединены в одну и будут показаны в списке находок одной строкой. Чтобы найти свой белок, иногда имеет смысл посмотреть в той части выдачи BLAST, где приведены выравнивания — там будут приведены все ID и AC записей, попавших в кластер (не забывайте, кстати, про предоставляемую браузером возможность поиска по странице).

      Что за белок является последним в выдаче программы? Каков его порядковый номер, Score, E-value? Объясните, почему программа не выдала больше находок. Какие параметры программы в данном случае надо изменить, чтобы находок стало больше? Проверьте своё предположение (указание: обратите внимание на гиперссылку "Algorithm parameters" внизу страницы запроса).
       

    2. Повторите поиск с той же входной последовательностью, указав в качестве банка pdb. Для первой в списке находки укажите: PDB-коды и идентификаторы цепей (кодов и цепей может быть несколько, поскольку последовательности белков из PDB подвергаются такой же кластеризации), Score, E-value, начало и конец выравнивания во входной последовательности (Query) и в находке (Subject), процент совпадений (Identity).

      Нашла ли программа ту запись PDB, с которой Вы работали в первом семестре? Если да, то каковы её порядковый номер, Score, E-value? По возможности прокомментируйте увиденное.

  2. Поиск белка по части его последовательности
  3. Повторите поиск по Swiss-Prot, подав на вход не всю последовательность, а (любую) её треть. Является ли исходная последовательность первой в списке находок? Как изменились Score и E-value? Объясните наблюдаемые изменения.
     

  4. Сравнение выравниваний, выданных программой BLASTP, с оптимальными глобальным и локальным выравниваниями.
  5. Среди выравниваний, выданных BLASTP (упр. 1), подберите выравнивание с процентом совпадений ("Identity") в диапазоне 40–80% и длиной не менее 60 позиций (если такого не найдётся, возмите максимально близкое по параметрам). Сравните его а) с оптимальным частичным выравниванием; б) с оптимальным полным выравниванием последовательностей тех же белков.

    Указания

Дополнительные задания

  1. Поэкспериментируйте с возможностью поменять в BLAST матрицу и штрафы за гэпы. Как меняется список находок и порядок их следования, а также E-value?
  2. Ознакомьтесь с интерфейсом к BLAST на сайте EBI (http://www.ebi.ac.uk/blastall/.