Занятие 10. BLASTP (продолжение)

Ваша рабочая директория — H:\Term2\Practice10 — протокол выполнения заданий должен содержаться в этой директории.

Внимание! Первую (обязательную) часть упражнения 1 в настоящее время (в связи с усовершенствованием web-интерфейса) невозможно выполнить на сайте NCBI!

(Кто сможет правильно объяснить, почему, тому 5 бонусных баллов!)

Поэтому выполняйте упражнение на сервере EBI: http://www.ebi.ac.uk/blastall/ Не забывайте указывать нужный банк для поиска!

Те, кто на 27 апреля уже попытались сделать на NCBI и написали отчёт, могут не переделывать; но всё же крайне желательно разобраться в причинах полученного результата.

  1. Поиск белка по фрагменту его последовательности
    1. Выберите в своём белке участок длиной 20–30 остатков и проведите поиск в банке swissprot, подав на вход этот участок. Сравните значения обычного веса ("Score"), веса в битах и E-value ("Expected") для первой находки и первой неправильной находки (т.е., такой, для которой процент идентичности меньше 100) при использовании для поиска матриц BLOSUM62 и PAM30.
       
    2. (*) Постарайтесь заменить несколько букв (чем меньше, тем лучше) во входной последовательности так, чтобы BLAST не нашёл по ней ваш белок (используйте матрицу BLOSUM62). Отчёт об успехах и неуспехах своих попыток поместите в протокол.

  2. (*) Разные пользовательские интерфейсы BLAST
  3. Повторите одно из заданий практикума 8, пользуясь интерфейсом к BLASTP на сервере Пастеровского института: http://bioweb.pasteur.fr/seqanal/interfaces/blast2-simple.html и на сервере Expasy: http://www.expasy.ch/tools/blast/. Опишите в протоколе ваши впечатления от сравнения интерфейсов NCBI, EBI, Пастеровского института и Expasy.


Для информации

Все матрицы серии BLOSUM доступны по анонимному FTP на сервере NCBI:
ftp://ftp.ncbi.nih.gov/repository/blocks/unix/blosum/BLOSUM
В этой директории файлы вида "blosumnn.blast.new" содержат матрицы в наиболее "читаемом" формате. Файлы с расширением "iij" содержат треугольные матрицы, остальные файлы — матрицы в форматах, требуемых разными программами, а также разные промежуточные стадии создания матриц (например. файлы blosum*.sij содержат матрицы из двоичных логарифмов условных вероятностей пар, то есть до умножения на 2 и округления до целого).

Оригинальную статью 1992 года, посвященную описанию серии BLOSUM, можно скачать — она свободно распространяется: http://www.pnas.org/cgi/reprint/89/22/10915