Учебная страница курса биоинформатики,
год поступления 2019
Практикум 11. Программа BLAST
Результаты — в виде отдельной страницы на своём сайте, со ссылкой со страницы семестра. Срок без штрафа — полдень 28 апреля, с минимальным штрафом — полночь с 5 на 6 мая.
При затруднениях см. указания.
1. Найдите гомологи вашего белка в БД Swissprot
- Опишите параметры, которые были использованы при запуске BLAST (в том числе открывающиеся при нажатии Algorithm parameters).
Сохраните текстовую выдачу программы (см. указания) и включите в отчёт гиперссылку на неё
Отберите 5–7 находок. Скачайте их в fasta-формате. Если ВСЕХ находок меньше пяти, то отметьте это обстоятельство.
- Создайте множественное выравнивание последовательности своего белка и отобранных находок
- Отредактируйте выравнивание, оставив в нём только гомологичные, по вашему мнению, белки. Обоснуйте гомологичность оставленных белков и негомологичность удалённых (если такие есть). Сохраните выравнивание как проект Jalview (jvp) и поставьте на него гиперссылку из отчёта. Как всегда, в проекте должно остаться ровно одно окно: с итоговым выравниванием.
2. Найдите в Swissprot гомологи последовательности зрелого вирусного белка из упр. 2 практикума 9
Всё то же, что в предыдущем упражнении, но в качестве запроса подайте на вход BLAST вырезанный из полипротеина 1ab зрелый белок вируса SARS или MERS. В отчёте обязательно укажите, что это за белок и каковы его координаты в полипротеине.
В этом упражнении НЕ используйте фильтр по организмам (в предыдущем — как хотите). При редактировании выравнивания в Jalview удалите все буквы находок, которые находятся до первой и после последней буквы, выровненной с какой-либо буквой исходного зрелого белка.
3. Исследование зависимости E-value от объёма банка
Повторите предыдущий поиск, оставив те же параметры BLAST, но теперь примените фильтр по организмам, ограничив поиск вирусами (Viruses). Изменился ли список находок?
В выдаче найдите какую-нибудь находку, чьё E-value поменялось по сравнению с предыдущим поиском. Путём сравнения значений E-value этой находки в двух поисках оцените долю вирусных белков в Swissprot.
4. (* – дополнительно) Сравнение интерфейсов BLAST
Сравните интерфейс к BLAST на сайте NCBI и каком-нибудь другом, например, EBI: https://www.ebi.ac.uk/Tools/sss/ncbiblast/, Expasy https://web.expasy.org/blast/ или Uniprot https://www.uniprot.org/blast/
Укажите достоинства и недостатки сравниваемых интерфейсов. Обращайте внимание на доступные банки, возможность выбора параметров, форму представления результата. В каких практических ситуациях, как вам кажется, удобнее использовать один сервис и в каких — другой?
5. (* – дополнительно) Поиск "гомологов" бессмысленной последовательности
Составьте последовательность длиной несколько десятков букв, которая почти наверняка не относится ни к какому белку. Например, можно взять какую-нибудь английскую фразу (хоть из Шекспира) и удалить из неё пробелы, знаки препинания. а также буквы B, J, O, U, X, Z, не обозначающие никаких "нормальных" аминокислот. Ещё можно найти в EMBOSS программу, генерирующую случайную аминокислотную последовательность, или написать такую самостоятельно на Python.
Подайте эту последовательность на вход BLAST и опишите результат как можно более подробно. Что в этой выдаче BLAST оказалось ожидаемо, а что нет?
Можно повторить несколько раз, с разными бессмысленными последовательностями и/или разными банками.