A picture of DNA should be here

ProSite

Для выполнения задания было взято множественное выравнивание из предыдущих двух практикумов. fasta файл с последовательностями вы можете найти здесь . Для поиска мотивов используется сервис Prosite.

К сожалению, специфических мотивов не было найдено, поэтому мной был выполнен поиск по распространенным мотивам.

Почти все наденные ScanProsite мотивы были длиной в 2-4 аминокислотных остатка, поэтому не были выбраны мной для исследования. Для дальнейшей рботы я выбрала MYRISTYL длиной 6 с идентификатором PS00008 (см. рис.1), представленный на рисунке 1. Известно, что терминальные N-концевые аминокислоты многих эукариотических белков ацилируются миристиновой кислотой через амидную связь. Найденная последовательность является сайтом связывания фермента, ответственного за этот процесс. Расположение мотива на множественном выравнивании вы можете увидеть на рис.2. Проект JalView, мотив находится на позициях 91-96 и обозначен плюсами в строке "Motif".

Рис. 1. Выбранный мотив ProSite, как один из результатов поиска

Рис. 2. Фрагмент выравнивания, содержащий мотив MYRISTIL

Данный мотив описан на странице следующим образом:

N-терминальная аминокислота должна быть глицином

В позиции 2 разрешены незаряженные аминокислотные остатки. Заряженные остатки, пролин и большие гидрофобные остатки запрещены.

В позиции 3 и 4 все остатки разрешены.

В позиции 5 маленькие незаряженные остатки разрешены (Ala, Ser, Thr, Cys, Asn and Gly). Серин преобладает.

В позиции 6 пролин запрещен.

Для выбранного мотива мной было составлено два паттерна - слабый и сильный, которые позволили найти последовательности гомологичные данным.

Сильный паттерн:

G-L-[AVM]-L-[ALV]-[LV]

Слабый паттерн, с учетом полученного результата и описания мотива (позиции, в которых было три разных вида аминокислот максимально расширены, в которых два - расширены до функциональной группы, абсолютно консервативные позиции оставлены неизменными):

G-L-X-L-[ALVGITSCN]-[LV]

Сильный паттерн найден в 1452 (не были включены варианты с альтернативным сплайсингом) последовательностях в базе данных SwissProt и достигнут лимит (10000) в Tremble.

Для слабого паттерна был достигнут лимит совпадений (10000) в обеих базах данных.

Довольно большое количество находок подтверждает тот факт, что данный мотив очень распространен (см. описание мотива выше и на указанной выше странице). К тому же, этот мотив достаточно короткий и состоит из распространенных аминокислот.