Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2016

Подсказки к заданию про паттерны

Как найти паттерны в последовательности

Зайдите на заглавную страницу Prosite ( https://prosite.expasy.org/ ) и внесите в окошко Quick Scan либо ID белка (например, PTH_ECOLI), либо его AC (например, P0A7D1), либо его последовательность в fasta-формате.

На странице с результатом ищите строку "hits by patterns" (профили — "hits by profiles" — нас пока не интересуют.). Под ней ищите строку на сером фоне, начинающуюся с букв "PS". Если таких строк несколько, значит в последовательности нашлось несколько паттернов. Сразу под этой строкой обратите внимание на координаты находки в белке. Сам идентификатор, начинающийся с PS, оформлен как гиперссылка на страницу соответствующего семейства. Ищите там слова "Consensus pattern" и сам паттерн под этими словами.

Что делать, если паттернов нет

К сожалению в нашем списке есть два семейства, для которых паттернов в банке Prosite нет. Если такое случилось, есть два выхода:

  1. Взять другое семейство и выровнять белки этого семейства из отобранных 7–8 (или, если не боитесь трудностей, всех 18) бактерий.
  2. Построить собственный паттерн без оглядки на Prosite.

В последнем случае нужно найти в выравнивании достаточно консервативный участок. Лучше, если он будет включать не менее пяти полностью консервативных столбцов. Далее составляете паттерн по следующим правилам:

Полное описание синтаксиса см. здесь: https://prosite.expasy.org/prosuser.html#conv_pa (помимо перечисленного выше, используются знаки < и > для мотивов в начале и в конце последовательности и фигурные скобки для перечисления букв, которые НЕ могут стоять в данной позиции; они вам вряд ли понадобятся).