Учебная страница курса биоинформатики,
год поступления 2019
Практикум 12
Результаты — в виде отдельной страницы на своём сайте, со ссылкой со страницы семестра. Срок без штрафа — полдень 6 мая, с минимальным штрафом — полночь с 12 на 13 мая.
Задание 1. Найдите отличия между двумя разными выравниваниями одних и тех же двух (или более) последовательностей
Достаточно описать три отличия.
Что такое отличие. Смысл выравнивания в том, что аминокислотные остатки из одной колонки считаются гомологичными. Поэтому если в одном выравнивании Ala125 стоит над Gly131, а в другом выравнивании Ala125 стоит над Gly132, то в этом месте выравнивания отличаются.
Нужно привести примеры конкретных пар остатков, с их номерами (нумерация по тому белку, из которого остаток, а не по позициям выравнивания!). Обязательны ссылки на оба выравнивания (в любом формате), краткое описание самих белков и методов получения обоих выравниваний. Желательно проиллюстрировать каждое найденное отличие.
Можно взять любые выравнивания, парные или множественные из 3–5 последовательностей.
Например, парное выравнивание, полученное из множественного путем удаления всех последовательностей, кроме двух, и выравнивание программой needle. Или множественные выравнивания, сделанные разными программами. Или выравнивание из BLAST и оптимальное локальное или глобальное. Или оптимальные выравнивания, полученные с разными параметрами вычисления веса.
Задание 2. Постройте и опишите карту локального сходства двух белков. Сравните с оптимальным локальным выравниванием.
В отчёте приведите:
- для обоих белков: ID, AC и полное рекомендуемое имя (всего белка, а не его части!),
- саму карту,
лучшее (по весу) из локальных выравниваний, изображённых на карте (в преформатированном виде, теги <pre>...</pre>)
- что написано в поле FT записей Uniprot про участки двух белков, попавшие в это выравнивание?
- отличается ли это выравнивание от выданного программой water при параметрах по умолчанию? Если да, то укажите на хотя бы одно отличие. Ответ типа "отличаются весом" не принимается, имеются в виду содержательные отличия, см. предыдущий пункт. Если участки, попавшие в два выравнивания (лучшее из BLAST и выданное water), не пересекаются, то:
- укажите это;
- постарайтесь найти среди выравниваний, выданных BLAST'ом, самое похожее на выравнивание из water и сравните с ним.
- описание карты: есть ли на ней ещё что-то существенное, кроме лучшего выравнивания; что в целом можно сказать о сходстве двух последовательностей на основании анализа карты?
По крайней мере один белок из пары должен быть из Swiss-Prot (Reviewed), иначе в поле FT вы ничего не найдёте.
Варианты пар белков
(для второго задания, но не возбраняется использовать и в первом)
- Полипротеины, один из любого штамма полиовируса (poliovirus), другой из любого штамма вируса ящура (foot-and-mouth desease virus)
- Гомеобелки, один — любой из Hox-белков человека, другой — белок "extradenticle" любого насекомого.
- Ципрозин (cyprosin), и просапозин (prosaposin).
- Белки цинковых пальцев (zinc finger), один из животного (Metazoa), другой из растения (Viridiplantae).
Можно взять свою пару белков, но карта должны быть "интересная": не просто диагональ и в то же время содержать выравнивания с E-value менее 1/100 хотя бы.
Замечание для особо хитрых: пункт про сравнение выравниваний BLAST и water из второго задания должен содержательно отличаться от ответа на первое задание. Можно брать те же белки, но тогда для первого задания нужно взять другие выравнивания.