Создание паттернов аминокислотных последовательностей



Работа с множественными выравниваниями
1.Рассмотренный мной участок выравнивания длины 15(красным подчёркнута последовательность AHPF_Ecoli)



Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
Фрагмент последовательности GKRVAVIGGGNSGVE 6 нет
Сильный [GN]-[KQ]-[RDE]-[VLI]-[LIAV]-V-[IV]-G(3)-[ND]-S-[AG]-[VFI]-[DE] 26 да
Слабый {VLIGA}-[VLI]-x-V-[IV]-G(3)-[ND]-S-[AG]-x 67 да


Очевидно, что, ища слабый паттерн, мы предъвляем наименее строгие требования к выдаваемым последовательностям, в случае с сильным (составленным по конкретному выравниванию), получаем значительно меньше результатов, и, наконец, когда мы ищем полностью консервативный участок, повторений совсем немного и те последовательности, которые, как мы уже видели, не полностью совпадают с нашей, в список, разумеется, не попадут.

2.
Идентификатор документа PROSITE (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (регулярное выражение) Специфична ли подпись? Сколько мотивов нашлось в белке?
PS51354 GLUTAREDOXIN_2 переносчик электронов в синтезе диоксирибонуклеотидов профиль [LIVMD] - [FYSA] - x(4) - C - [PV] - [FYWH] - C - x(2) - [TAV] - x(2,3) - [LIV] да 1
PS00573 PYRIDINE_REDOX_2 содержит дисульфидный мостик, участвующий в окислении ФАД паттерн C - x(2) - C - D - [GAS] - x(2,4) - [FYA] - x(4) - [LIVMAT] - x(0,1) - [LIVM](2) - [GI] - [GDS] - [GRD] - [DN] да 1
PS00006 CK2_PHOSPHO_SITE фосфорилирующий участок Ca-независимой казеинкиназы паттерн [ST] - x(2) - [DE] нет 9
PS00005 PKC_PHOSPHO_SITE фосфорилирующий участок протеинкиназы (фосфорилирует, в осн., остатки серина и треонина вблизи С-конца) паттерн [ST] - x - [RK] нет 6
PS00004 CAMP_PHOSPHO_SITE фосфорилирующий участок cAMP-зависимой протеинкиназы паттерн [RK](2) - x - [ST] нет 1
PS00008 MYRISTYL к этому участку, содержащему глицин, присоединяется остаток жирной миристиновой к-ты паттерн G - {EDRKHPFYW} - x(2) - [STAGCN] - {P} нет 13
PS00009 AMIDATION x(чаще фенилаланин или валин) подвергается амидированию паттерн x - G - [RK] - [RK] нет 1