Kodomo

Пользователь

Задания по теме лекции 7

Отчёты присылать С.А.Спирину sas@belozersky.msu.ru до 22 апреля 2019.

Задания можно выполнять, используя веб-интерфейc к программе BLAST на одном из трёх сайтов:

Важно! Поиск нужно осуществлять по банку Swiss-Prot (он же UniProtKB/Swiss-Prot ), в двух из трёх случаев по умолчанию стоит другой банк, будьте внимательны!

  1. Выберите один из фрагментов белковых последовательностей (обязательно укажите в отчёте, какой фрагмент был выбран).

  2. Найдите данный фрагмент в банке Swiss-Prot. Ответьте на вопросы:
    • из какого белка данный фрагмент? (идентификатор в Swiss-Prot, вида XXXX_YYYYY, и краткое описание данного белка). Желательно перевести описание на русский язык.

    • каковы координаты фрагмента в полноразмерном белке (начало – конец)?

    • из какого организма белок (латинское и, желательно, русское название)?
  3. Найдите гомологи найденного на предыдущем шаге белка в банке Swiss-Prot. Ответьте на вопросы:
    • сколько всего гомологов нашлось?
    • есть ли гомологи, для которых аннотирована другая функция?
    • для одного из гомологов (желательно с другой функцией, если таких нет, то не из верхней пятёрки):
      • что за белок? (идентификатор в Swiss-Prot, краткое описание, из какого организма).
      • координаты выровненных участков (участок от-до в исходном белке выровнен с учаcтком от-до в гомологе).
      • характеристики выравнивания: вес (Score) обычный и в битах, число и процент совпадений, E-value (Expected).
  4. (* – дополнительно). Проделайте поиск гомологов из предыдущего упражнения на всех трёх сайтах. Опишите свои впечатления: что на каком сайте сделано удобнее или, наоборот, хуже.

  5. (* – дополнительно). Попробуйте "поиграть" с параметрами программы BLAST (матрица замен, штрафы за гэпы, длина слова): что меняется в списке находок и/или в характеристиках выравниваний?

Указания

  1. Фрагменты лежат в fasta-формате: строка с последовательностью фрагмента находится после строки с условным идентификатором фрагмента.

Например, вы видите такое:

>abc
AAAATTTTGGGG

значит, "abc" — идентификатор (указываете в отчёте: "Я выбрал фрагмент abc"), а AAAATTTTGGGG — последовательность фрагмента, которую вам нужно искать в банке.

  1. Разберитесь, куда копировать последовательность и как задать нужный банк (в вашем случае это Swiss-Prot). Получив результат поиска, нужно для первой (если их несколько) находки по гиперссылкам искать нужную инофрмацию.

  2. Теперь вам нужно запустить BLAST, используя в качестве запроса ("Query") всю последовательность найденного на предыдущем шаге белка.
    • число находок, если оно большое, не всегда легко определить... но всё же попытайтесь! Если совсем никак, попробуйте другой сайт.
    • в первом приближении можно считать, что функция белка из Swiss-Prot закодирована в первой части его идентификатора (если идентификатор XXXX_YYYYY, то "XXXX" — это код функции).

    • внимательнее с координатами выровненных участков: одно выравнивание обычно занимает несколько "блоков", нужны координаты не из отдельных блоков, а из всего выравнивания (от начала первого блока до конца последнего).
    • если написано "Score = 333 bits (854)", то в скобках — обычный вес. В данном случае вес в битах 333, а обычный — 854.