Учебная страница курса биоинформатики,
год поступления 2016
Подсказки к заданию про паттерны
Как найти паттерны в последовательности
Зайдите на заглавную страницу Prosite ( https://prosite.expasy.org/ ) и внесите в окошко Quick Scan либо ID белка (например, PTH_ECOLI), либо его AC (например, P0A7D1), либо его последовательность в fasta-формате.
На странице с результатом ищите строку "hits by patterns" (профили — "hits by profiles" — нас пока не интересуют.). Под ней ищите строку на сером фоне, начинающуюся с букв "PS". Если таких строк несколько, значит в последовательности нашлось несколько паттернов. Сразу под этой строкой обратите внимание на координаты находки в белке. Сам идентификатор, начинающийся с PS, оформлен как гиперссылка на страницу соответствующего семейства. Ищите там слова "Consensus pattern" и сам паттерн под этими словами.
Что делать, если паттернов нет
К сожалению в нашем списке есть два семейства, для которых паттернов в банке Prosite нет. Если такое случилось, есть два выхода:
- Взять другое семейство и выровнять белки этого семейства из отобранных 7–8 (или, если не боитесь трудностей, всех 18) бактерий.
- Построить собственный паттерн без оглядки на Prosite.
В последнем случае нужно найти в выравнивании достаточно консервативный участок. Лучше, если он будет включать не менее пяти полностью консервативных столбцов. Далее составляете паттерн по следующим правилам:
- позиции паттерна разделяются дефисом;
- каждая позиция соответствует либо столбцу выравнивания (из выбранного участка), либо отрезку последовательностей разной длины;
- консервативному столбцу отвечает позиция из одной буквы, например L;
столбцу, включающему несколько родственных букв, отвечает позиция вида [ILMV] (в квадратных скобках — все буквы, которые могут встретиться в данном столбце);
- одиночному неконсервативному столбцу отвечает позиция вида x (такую позицию не имеется смысла ставить в начале и ли конце паттерна);
- отрезку переменной длины отвечат позиция вида x(1,5) (отрезок из любых букв длиной от 1 до 5);
- паттерн оканчивается точкой.
Полное описание синтаксиса см. здесь: https://prosite.expasy.org/prosuser.html#conv_pa (помимо перечисленного выше, используются знаки < и > для мотивов в начале и в конце последовательности и фигурные скобки для перечисления букв, которые НЕ могут стоять в данной позиции; они вам вряд ли понадобятся).