Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2021

Практикум 10. Программа BLAST

Результаты — в виде отдельной страницы на своём сайте, со ссылкой со страницы семестра. Срок без штрафа — утро 26 апреля, с минимальным штрафом — утро 3 мая.

При затруднениях см. указания.

Задания 1–3 делаются на сайте NCBI: https://blast.ncbi.nlm.nih.gov/, там пройдите по ссылке Protein BLAST.

1. Найдите в Swissprot гомологи вашего белка

Ваш белок — тот же, что в практикуме 7.

2. Найдите в Swissprot гомологи зрелого вирусного белка, вырезанного из полипротеина

3. Исследование зависимости E-value от объёма банка

Повторите предыдущий поиск, оставив те же параметры BLAST, но теперь примените фильтр по организмам, ограничив поиск вирусами (Viruses). Изменился ли список находок?

В выдаче найдите какую-нибудь находку, чьё E-value поменялось по сравнению с предыдущим поиском. Путём сравнения значений E-value этой находки в двух поисках оцените долю вирусных белков в Swissprot.

4. (* – дополнительно) Сравнение интерфейсов BLAST

Сравните интерфейс к BLAST на сайте NCBI и каком-нибудь другом, например, EBI: https://www.ebi.ac.uk/Tools/sss/ncbiblast/, Expasy https://web.expasy.org/blast/ или Uniprot https://www.uniprot.org/blast/

Укажите достоинства и недостатки сравниваемых интерфейсов. Обращайте внимание на доступные банки, возможность выбора параметров, форму представления результата. В каких практических ситуациях, как вам кажется, удобнее использовать один сервис и в каких — другой?

5. (* – дополнительно) Поиск "гомологов" бессмысленной последовательности

Составьте последовательность длиной несколько десятков букв, которая почти наверняка не относится ни к какому белку. Например, можно взять какую-нибудь английскую фразу (хоть из Шекспира) и удалить из неё пробелы, знаки препинания. а также буквы B, J, O, U, X, Z, не обозначающие никаких "нормальных" аминокислот. Ещё можно найти в EMBOSS программу, генерирующую случайную аминокислотную последовательность, или написать такую самостоятельно на Python.

Подайте эту последовательность на вход BLAST, установите порог на E-value, равный 10, и опишите результат как можно более подробно. В первую очередь нужно уделить внимание числу находок с E-value лучше 10 (и других чисел), но на выравнивания тоже стоит посмотреть. Что в этой выдаче BLAST оказалось ожидаемо, а что нет?

Можно повторить несколько раз, с разными бессмысленными последовательностями и/или разными банками.

2021/2/pr10 (последним исправлял пользователь is_rusinov 2022-04-25 19:42:15)