Множественное выравнивание. Мотивы и паттерны. Материалы к занятию 11 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||
Упражнение 1. Создать множественное выравнивание последовательности Вашего белка и 45-ти его гипотетических ортологовС помощью программы blastp найдите в банке Swiss-Prot предпологаемые гомологи вашего белка. Из них выберите 45 наиболее вероятных ортологов (в первом приближении будем считать признаком ортологичности cовпадение названий белков из разных организмов), с процентом идентичности в диапазоне 40–80% (если таких не набирается 5, то можно выйти из этого диапазона, но процент идентичности должен быть не более 90%, а E-value находки не хуже (т.е., не больше) 0,001).Получите файл с последовательностями Вашего белка и всех отобранных "ортологов" в формате FASTA, названия последовательностей должны представлять собой ID записей Swiss-Prot Внимание! Сервер NCBI позволяет получить сразу несколько последовательностей в формате FASTA, подробнее см. подсказку. Правда, названия последовательностей придется редактировать "руками". С помощью программы muscle постройте множественное выравнивание Вашего белка и его "ортологов". Импортируйте его в GeneDoc. Выберите консервативный фрагмент выравнивания длиной 820 а.о. для дальнейшего исследования. Экспортируйте фрагмент в HTML-формат. Упражнение 2. Создать паттерны по множественному выравниванию и провести поиск по паттернам в банке данных Swiss-ProtРассмотрите выбранный Вами фрагмент множественного выравнивания. Создайте паттерны и запишите их в таблицу, см. ниже.
[ALK] в данной позиции разрешены только остатки в квадратных скобках; Х(3) интервал в 3 любых остатка; {WY} запрет на остатки в фигурных скобках, подробнее см. в правилах написания патернов (ссылки — в подсказке).
Имеет смысл в сильный паттерн включить все позиции вашего
фрагмента выравнивания, а в каждой позиции
(кроме, разумеется, тех, в которых оказались гэпы)
разрешить все буквы, встретившиеся в какой-либо из
последовательностей. При создании слабого паттерна можно
пользоваться (одновременно или по отдельности) следующими приёмами: Проведите поиск последовательностей банка Swiss-Prot, включающих мотивы, соответствующие каждому из полученных паттернов. По результатам упражнения заполните табличку следующего вида:
Упражнение 3. Найти и описать все мотивы в Вашем белке (по данным БД PROSITE)Найдите в последовательности вашего белка все мотивы, описанные в PROSITE, в том числе неспецифичные (часто встречающиеся). По результатам поиска составьте следующую таблицу.
Формат отчета |