Подсказки к занятию 6

  1. К упражнению 1
    • Внимание: на сайте NCBI банки данных подвергнуты "кластеризации": записи с одинаковой последовательностью (часто таковыми являются, например, белки из разных штаммов E. coli) объединены в одну и будут показаны в списке находок одной строкой. Чтобы найти свой белок, иногда имеет смысл посмотреть в той части выдачи BLAST, где приведены выравнивания — там будут приведены все ID и AC записей, попавших в кластер.
      Если же кластер слишком большой, то часть идентификаторов последовательностей может быть даже скрыта в выпадающем меню! Будьте внимательны!

    • Для поиска идентификатора изучаемого белка удобно использовать предоставляемую браузером возможность поиска по странице

    • Среди находок в БД "nr" с одинаковыми значениями E-value предпочтение отдавайте находкам с идентификаторами Swiss-Prot.

    • Если кажется, что разумных находок должно быть больше, обратите внимание на гиперссылку "Algorithm parameters" внизу страницы запроса.

  2. К упражнению 2
  3. Проведите поиск гомологов заданного белка по Swiss-Prot, при этом введите название таксона в окошко "Organism".
    Внимание! Blastp тут же начнет подсказывать название таксона, если предлагаемое название подходит, соглашайтесь! т.е. щелкните по предлагаемому варианту.
    Если гомолог не найден, то вернитесь на страницу запроса и введите название следующего таксона и т.д.

  4. К упражнению 3
  5. На страничке выдачи программы BLASTP в разделе "Alignments" выберите нужные находки, отметьте их галочками и нажмите кнопку "Get selected sequence". На открывшейся страничке в меню "Display" выберите FASTA, а в меню "Send to" выберите File.

  6. К упражнению 4
    • Сравнивать выравнивание, выданное BLAST, с оптимальным выравниванием имеет смысл, если последнее является оптимальным для функции Score, вычисляемой при тех же значениях штрафов за создание и удлинение гэпа, которыми пользовался BLAST. Поэтому прежде всего загляните в меню "Algorithm parameters" в самом конце страницы запроса BLASTP и из строки "Gap Costs" извлеките необходимую информацию. Затем постройте оптимальные локальное и глобальное выравнивания полных последовательностей соответствующих белков при тех же параметрах. Сравните значения Score, длины выравниваний, проценты совпадения и сходства, а также сами выравнивания. Последнее означает сравнить имеющиеся сопоставления остатков одного белка остаткам другого в каждом из случаев.
    • Оптимальное глобальное выравнивание двух последовательностей находят программы пакета EMBOSS needle и stretcher; оптимальное локальное выравнивание — программы water и matcher.
    • Программы needle и water при запуске запрашивают значения штрафов. Чтобы задать значения штрафов программам stretcher и matcher, надо либо запустить их с опцией -options (и тогда они запросят значения), либо явно указать значения в командной строке в следующей форме:
       stretcher  -gapopen a  -gapextend b
      
      (вместо a и b должны стоять целые числа; для matcher имена параметров те же).
    • Ещё раз: сравнить два выравнивания (одной и той же пары последовательностей) означает разобраться, какие сопоставления остаток-остаток в этих выравниваниях общие, а какие различаются. Разумеется, не нужно описывать отдельно каждый столбец выравнивания, но общая картина должна быть ясна (например: "выравнивание 1 включает остатки от ... до ... в последовательности XXX и остатки от ... до ... в последовательности YYY, все сопоставления в этом диапазоне те же, что у выравнивания 2, которое включает ..." и т.д. Или "... все сопоставления те же, кроме пяти на участке ... ". Или "... большая часть сопоставлений различается — выравнивания различны почти везде, за исключением участка ...").
    • От вас ожидается проявление умения описывать наблюдаемый феномен в понятных выражениях, что может потребовать определённых мыслительных усилий!