Занятие 6. Программа BLASTP

Ваша рабочая директория — H:\Term2\Practice6, в ней храните все рабочие файлы.
Формат отчета — HTML-страничка, прикрепленная к странице второго семестра

Рекомендуем следующий порядок оформления отчета: скопируте эту страничку с заданием, заполните готовые таблички, удалите текст задания, оставив только заголовки, и добавьте текст ваших комментариев.

При выполнении первых двух упражнений пользуйтесь web-интерфейсом к BLASTP на сервере NCBI: http://www.ncbi.nlm.nih.gov/blast/, далее в разделе Basic BLAST переходите по гиперссылке "protein blast". Не забывайте указывать нужный банк для поиска!

На сайте NCBI есть хорошие и не очень сложные учебники по BLAST

  1. Поиск гипотетических гомологов изучаемого белка в разных БД
  2. Подайте на вход программе BLASTP код доступа изучаемого белка, проведите поиск гомологов в банке Swiss-Prot и заполните первый столбец таблички. Затем проведите поиск по банкам PDB и "nr" и заполните остальные столбцы.
    Внимание: для этого надо изменять значение параметра database, по умолчанию стоит банк "nr".

    Таблица 1. Результаты поиска гипотетических гомологов белка XXXX_ECOLI

      Поиск по БД Swiss-Prot Поиск по БД PDB Поиск по БД "nr"
    1. Лучшая находка (в принципе должна соответствовать заданному белку)
    Идентификатор БД      
    E-value      
    Вес (в битах)      
    % идентичности      
    Найдены ли другие белки с теми же значениями E-value и веса в битах?
    Если найдены, то укажите общее число и приведите один идентификатор (любой, но желательно Swiss-Prot ID)
         
    2. Сколько хороших кандидатов в гомологи найдено? (число находок в списке описаний, Descriptions, с E-value < 1E-10)      
    2. "Худшая" находка (последняя в выдаче с E-value < 1)
    Номер находки в списке описаний (Descriptions)      
    Идентификатор БД      
    E-value      
    Вес (в битах)      
    % идентичности      
    % сходства      
    Длина выравнивания      
    Координаты выравнивания (номера первых и последних а.о.)      
    % гэпов      

    см. подсказки.

    В кратком комментарии к таблице

  3. Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам
  4. Ваша задача — для изучаемого белка E. coli найти лучшего гомолога в организмах таксона, филогенетически как можно более далекого от E. coli.
    Для исследования предлагаются следующие таксоны: Homo sapiens, Archaea, Actinobacteria, Alteromonadales, Vibrionaceae (приведены в порядке приближения к E. coli). В этом же порядке проверяйте на наличие гипотетического гомолога (критерий: E-value<0,001). Как только найден первый такой гомолог, прекращайте поиск. Опишите результаты поиска по той же схеме, по которой описывали "худшую" находку в табл.1.

    Как быстро выполнить это упражнение, см. в подсказках.

  5. Поиск белка по его фрагменту
  6. На первом занятии блока вы сравнивали фрагмент заданного белка с фрагментом неизвестного белка. Сейчас ваша задача — определить, из какого белка был взят второй фрагмент, и получить его полную последовательность в формате FASTA.
    Для этого на страничке запроса BLASTP введите в окошко "Query sequence" нужный фрагмент и проведите поиск по Swiss-Prot, по результатам поиска заполните первый столбец табл.2
    Затем получите полную последовательность найденного белка любым уже известным вам способом: с помощью SRS или с помощью программы seqret. Последовательность можно получить также прямо cо странички выдачи BLAST, см. подсказки, но, увы, эта опция часто зависает при запросе одной последовательности. Сохраните полученную последовательность в рабочей директории, а в отчете укажите Swiss-Prot ID и AC.
    Проведите поиск полной полученной последовательности в Swiss-Prot и заполните второй столбец. В кратком комментарии объясните различия между результатами поиска по полной последовательности и по ее фрагменту.
    Найдите на листе выдачи последнего поиска выравнивание с изучаемым вами белком из E. coli. Вставьте его в отчет как преформатированный текст. Определите в выравнивании те фрагменты, которые вы сравнивали с помощью GeneDoc. Совпало ли ваше пробное выравнивание с тем, что выдал BLASTP? Приведите краткое резюме в отчете.

    Таблица 2. Результаты поиска белка в Swiss-Prot по фрагменту последовательности

      Поиск по фрагменту Поиск по полной
    последовательности
    АС лучшей находки    
    E-value    
    Вес (в битах)    
    Найдены ли другие белки с теми же значениями E-value и веса в битах?
       

  7. Сравнение выравниваний, выданных программой BLASTP, с оптимальными глобальным и локальным выравниваниями.
  8. При выполнении предыдущего упражнения вы получили выравнивание двух белков. Сравните это выравнивание, выданное BLASTP,
    а) с оптимальным частичным выравниванием;
    б) с оптимальным полным выравниванием последовательностей тех же белков.
    см. подсказки.

    На страничке отчета приведите 3 разных выравнивания и краткий комментарий, в котором отметьте наиболее драматические различия между выравниваниями.