Занятие 12. Множественные выравнивания, дополнительные упражнения на бонусные баллы

Отчет по каждому упражнению может быть оценен на 0-5 баллов.
Лучше выполнить хорошо одно, чем плохо все три, в последнем случае можно вообще заработать 0.
Отчет оформить в виде HTML-странички.

Доп. упр. 1 Исследование доменной структуры Вашего белка.
Опишите все мотивы, найденные в аминокислотной последовательности Вашего белка (InterPro): приведите картинку-схему, дайте краткую характеристику каждому мотиву - название мотива, название БД, в которой описан, перевод описания..
Внимание, структурные мотивы пока не рассматриваем!

Исследуйте домены из PFAM и ответьте на вопросы
1) насколько распространенным является данный домен?
2) в сочетании с какими другими доменами встречается?
3) известны ли примеры перемешивания (перетасовки) данного домена с другими?
4) сколько известно 3D-структур данного домена?

*Приведите пример пары ортологичных белков с таким доменом. Ортологичность попробуйте обосновать.
*Приведите пример пары паралогичных белков с таким доменом. Паралогичность попробуйте обосновать.

Доп. упр. 2 Исследование консервативных позиций в аминокислотной последовательности Вашего белка.
Создайте выборку из 10-20 аминокислотных последовательностей потенциальных ортологов Вашего белка. В первом приближении будем считать ортологом последовательность с ID~40-60% и функциональной аннотацией в UniProt (поле "Description"), такой же (или очень похожей) на аннотацию у заданного белка.
Постройте множественное выравнивание любым разумным способом.
Определите а.о. в Вашем белке консервативные на 100%, 80%, 50%. (Genedoc, экспорт в html-формате).
Отметьте выбранные позиции на 3D-структуре Вашего белка. (RasMol, скрипт, картинка в формате gif).
Внимание - картинка не должна представлять собой пеструю кучу!
Предложите гипотезу, почему именно эти а.о. оказались самыми консервативными.

Доп. упр. 3 Попробовать создать правило, распознающее ортологов Вашего белка.
Создайте выборку аминокислотных последовательностей и постройте их множественное выравнивание так же, как в доп. упр.2.
Импортируйте выравнивание в Genedoc, выделите цветом консервативные позиции.
Составьте распознающий паттерн в соответствии с синтаксисом PROSITE
Паттерны, совпадающие с паттернами из PROSITE более, чем на треть символов, не принимаются!
Проведите поиск в UniProt аминокислотных последовательностей, удовлетворяющих заданному паттерну. Возможно, придется настроить паттерн, сделать его слабее или сильнее, и повторить поиск. Среди находок определите долю потенциальных ортологов (выбор обосновать). Как вести поиск, см. подсказку