Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2017

Практикум 11

1. Характеристики списка находок

Повторите упражнение 3 предудыщего практикума: поиск гомологов своего белка в Swiss-Prot.

Укажите в отчёте:

2. Изменение длины слова

Измените длину слова с 6 на 2 и повторите поиск. Опишите отличия результата (если они есть), по тем же пунктам: общее число находок, число находок с E-value<0.001, максимальное E-value.

Для следующего задания: возьмите одну из находок данного поиска с достаточно хорошим (<0.001), но ненулевым E-value. Зайдите в соответствующую запись Swiss-Prot и спишите таксономию организма, из которого взят белок. Выберите один из достаточно "высоких" таксонов (но не самый высокий; лучше всего второй сверху). Запишите также E-value выравнивания с этой находкой.

3. Изменение объёма поиска

Повторите предыдущий поиск, ограничив его выбранным таксоном (банк тот же, длину слова оставьте равной 2). Найдите выбранную находку и сравните её E-value при этом поиске с E-value, полученном при предыдущем поиске. Сделайте вывод о количестве последовательностей белков из данного таксона в банке.

Может ли из-за изменения объёма поиска измениться Score (обычный или битовый)?

4. (* — дополнительно). Другие веб-интерфейсы BLASTP

Протестируйте два других популярных веб-интерфейса: на сайте Uniprot (с основной страницы Uniprot гиперссылка BLAST в левом верхнем углу) и/или на сайте Европейского биоинформатического института: https://www.ebi.ac.uk/Tools/sss/ncbiblast/ . Обратите внимание на возможности выбора параметров, в том числе доступные банки, а также на форму подачи результатов поиска. Опишите различия между интерфейсами и свои рекомендации, в каких ситуациях какой интерфейс может оказаться удобнее.

5. (* — дополнительно). Плохая матрица

Проверьте утверждение: если вместо BLOSUM62 использовать устаревшую матрицу аминокислотных замен PAM250, то E-value большинства хороших находок ухудшится, а самих находок станет меньше.