PSI-BLAST

Материалы к занятию 13
 
     

1. Проведите с помощью программы blastp поиск гомологов белка LGB1_LUPLU (P02239) в БД SwissProt.

На главной страничке сервера NCBI выберите на панели меню BLAST, а в открывшемся списке вариантов — программу blastp.

Прежде чем проводить поиск, запишите параметры поиска:
   учет особенностей аминокислотного состава (Compositional adjustments) —...... (значение по умолчанию);
   фильтрование областей низкой сложности — .........(значение по умолчанию);
   максимальное значение E-value —..... (значение по умолчанию).
Максимальное количество находок (Number of Descriptions ) сделайте равным 1000.

При поиске воспользуйтесь тем, что сервер NCBI может вести поиск не только по последовательности, но и по коду доступа UniProt.

Получив результат, исследуйте, в каких таксонах обнаружены гомологи.
Для этого используйте фильтр по таксонам на страничке "formatting Blast".
Подсказка. Общее число найденных последовательностей с E-value, меньшим заданного порога, можно увидеть в начале странички выдачи над диаграммой.

По результатам поиска заполните таблицу отчета №1.
Подсказка. Скопируйте HTML-коды таблицы в свой отчет.

Таблица отчета 1. Поиск гомологов белка LGB1_LUPLU (P02239) в БД SwissProt

Параметры программы blastp:
   учет особенностей аминокислотного состава (Compositional adjustments);
   фильтр на области низкой сложности;
   максимальное значение E-value;
   максимальное количество находок (Number of Descriptions ).

  Кол-во E-value лучшей находки Название лучшей находки (ID ) % идентичности Длина выравнивания
Всего находок          
В бактериях (Bacteria)          
В Escherichia coli K-12          
В животных (Metazoa)          
В человеке          

В кратком комментарии ответьте на вопрос, удалось ли обнаружить гомологов среди белков человека и кишечной палочки?

2. Проведите с помощью программы PSI-BLAST поиск гомологов LGB1_LUPLU (P02239) в БД SwissProt.

На страничке с перечнем вариантов программы (см. упр.1) найдите программу PSI-BLAST. Проверьте, чтобы параметры поиска совпали с параметрами, заданными в первом упражнении!

Результаты каждой итерации занесите в таблицу 2. Поиск ведите до тех пор, пока в списке значимых находок не перестанут появляться новые последовательности.

Подсказки
Скопируйте HTML-коды таблицы в свой отчет.
По умолчанию программа PSI-BLAST строит профиль PSSM по последовательностям с E-value<0.005. В столбец "Кол-во" таблицы следует записать количество таких находок. Для быстрого подсчета используйте редактор FAR Manager: скопируйте все значимые находки в текстовой файл и определите число строк.
Значком "+" или "–" отметьте наличие или отсутствие новых последовательностей на каждой итерации.

Таблица 2. Итерационный поиск гомологов LGB1_LUPLU (P02239) в БД SwissProt с помощью программы PSI-BLAST
Параметры программы...

Номер итерации
Бактерии
Животные
Характеристика лучшей находки среди белков
Escherichia coli, K-12
Homo sapiens sapiens
Кол-во
Новые
Кол-во
Новые
Название
E-value
% идентичности
Длина выравнивания
Название
E-value
% идентичности
Длина выравнивания
1
                       
2
                       
 
                       

В отчете ответьте на следующие вопросы.

  1. Для решения каких задач нужно использовать PSI-BLAST?
  2. Что представляет собой первая итерация PSI-BLAST?
  3. Что удалось найти, по Вашему мнению, в результате упражнения №2?
  4. Что происходило с "лучшими находками" на разных итерациях? Предложите объяснения.
  5. Дополнительные вопросы для тех, кому интересно, и кто быстро справился с основными упражнениями..

  6. *Возможны 2 стратегии. Первая состоит в том, чтобы на каждой итерации вести поиск по всем организмам. Вторая состоит в том, чтобы после первой итерации отфильтровать находки по интересному для Вас таксону, и затем запустить следующие итерации. Какие отличия можно ожидать в результатах?
  7. *Определите, какие остатки контактируют с гемом в "лучших находках" среди белков человека (см. поле особенностей документов UniProt). Проверьте, сохраняются ли эти аминокислотные остатки в LGB1_LUPLU, а также в "лучшей" находке среди белков кишечной палочки. Сделайте выводы из полученных результатов.
  8. **Сохраните файл с профилем PSSM. Объясните, что в нем написано, как это можно использовать.
Формат отчета
Отчет представить в виде HTML-странички, названной "PSI-BLAST".
Содержание отчета — 2 таблицы, комментарии к ним и ответы на поставленные вопросы.