Учебная страница курса биоинформатики,
год поступления 2017
Практикум 11
1. Характеристики списка находок
Повторите упражнение 3 предудыщего практикума: поиск гомологов своего белка в Swiss-Prot.
Укажите в отчёте:
- сколько всего находок;
- сколько находок с E-value менее одной тысячной;
- каково максимальное E-value находки, выданное программой;
- чем оказался лимитирован список находок: порогом на E-value или максимальным числом находок?
- если список лимитирован максимальным числом находок, повторите поиск, увеличив максимальное число; постарайтесь добиться того, чтобы находок было меньше заданного максимума; в отчёте опишите, что делали и что получили (в частности, каково теперь максимальное E-value)
2. Изменение длины слова
Измените длину слова с 6 на 2 и повторите поиск. Опишите отличия результата (если они есть), по тем же пунктам: общее число находок, число находок с E-value<0.001, максимальное E-value.
Для следующего задания: возьмите одну из находок данного поиска с достаточно хорошим (<0.001), но ненулевым E-value. Зайдите в соответствующую запись Swiss-Prot и спишите таксономию организма, из которого взят белок. Выберите один из достаточно "высоких" таксонов (но не самый высокий; лучше всего второй сверху). Запишите также E-value выравнивания с этой находкой.
3. Изменение объёма поиска
Повторите предыдущий поиск, ограничив его выбранным таксоном (банк тот же, длину слова оставьте равной 2). Найдите выбранную находку и сравните её E-value при этом поиске с E-value, полученном при предыдущем поиске. Сделайте вывод о количестве последовательностей белков из данного таксона в банке.
Может ли из-за изменения объёма поиска измениться Score (обычный или битовый)?
4. (* — дополнительно). Другие веб-интерфейсы BLASTP
Протестируйте два других популярных веб-интерфейса: на сайте Uniprot (с основной страницы Uniprot гиперссылка BLAST в левом верхнем углу) и/или на сайте Европейского биоинформатического института: https://www.ebi.ac.uk/Tools/sss/ncbiblast/ . Обратите внимание на возможности выбора параметров, в том числе доступные банки, а также на форму подачи результатов поиска. Опишите различия между интерфейсами и свои рекомендации, в каких ситуациях какой интерфейс может оказаться удобнее.
5. (* — дополнительно). Плохая матрица
Проверьте утверждение: если вместо BLOSUM62 использовать устаревшую матрицу аминокислотных замен PAM250, то E-value большинства хороших находок ухудшится, а самих находок станет меньше.