Практикум 6. Мотивы в белках. PSSM и паттерны. PSI-BLAST. Банк Prosite

Для выполнения задания был выбран белок с AC Q7VDL2. Данный белок ингибирует клеточное деление, предотвращая формирование Z-кольца. Он быстро колеблется между полюсами клетки, чтобы дестабилизировать фибриллы FtsZ, которые сформировались до того, как они созревают в полярные Z-кольца. Предотвращает полимеризацию FtsZ.
Выбранная функциональная группа - RF1 (фактор освобождения пептидной цепи).
Организм: Prochlorococcus marinus subsp. marinus str. CCMP1375 Bacteria; Cyanobacteria; Synechococcales; Prochloraceae; Prochlorococcus.
Было проведено пять интераций, после чего результат стабилизировался.
Номер итерации Число находок выше порога (0,005) Идентификатор худшей находки выше порога E-value этой находки Идентификатор лучшей находки ниже порога E-value этой находки
1 146 Q9AG20.1 0.005 Q7VDL2.1 4e-159
2 188 B6JKX0.1 7e-08 Q7VDL2.1 5e-93
3 188 Q9ZM51.1 2e-12 B5R2V6.1 3e-72
4 189 A8MHK8.1 0.001 A4JCA7.1 6e-75
5 189 A8MHK8.1 4e-10 Q8ZES5.1 4e-81
Название семейства в Prosite: PS00745, RF_PROK_I, Prokaryotic-type class I peptide chain release factors signature
Паттерн:
[ARH]-[STA]-x-G-x-G-G-Q-[HNGCSY]-[VI]-N-x(3)-[ST]-[AKG]-[IV]
Паттерн был уточнем с помощью выравнивания.
Ссылка на выравнивание
Уточненный паттерн:
D-[IL]-[RK]-I-[DE]-T-[MF]-R-[AS]-[QS]-G-A-G-G-Q-H-[VI]-N-[TK]-T-[DE]-S-A-[IV]-R-[IV]-T-H-[IL]-P-[TS]-G

Результаты анализа поиска по паттерну с помощью excel:
TP (верно обнаруженные) = 424
FP (ложно обнаруженные) = 56
FN (ложно проигнорированные) = 0