Мотивы в белках. PSSM и паттерны. PSI-BLAST. Банк Prosite

Практикум 10

PSI-BLAST

     Выбранный белок: P74518 (Ribosome hibernation promotion factor). Функция: Необходим для димеризации активных рибосом 70S в рибосомы 100S в стационарной фазе. 100S рибосомы трансляционно неактивны и иногда присутствуют при экспоненциальном росте. Организм: Synechocystis sp. PCC 6803 (Bacteria; Cyanobacteria; Synechococcales; Merismopediaceae; Synechocystis).

Таблица итераций
Номер итерации Число находок выше порога (0,005) Идентификатор худшей находки выше порога E-value этой находки Идентификатор лучшей находки ниже порога E-value этой находки
1 24 P33987.1 3e-05 Q65SX3.1 4.8
2 28 P9WMA8.1 3e-06 Q5K2N3.3 0.15
3 28 P24694.1 2e-20 Q0BSD5.2 0.064
4 28 P24694.1 2e-20 Q0BSD5.2 0.064

     Было проведено 4 итерации со стандартными параметрами по банку Swissprot. Как понятно из результатов: выборка стабилизировалась уже на второй итерации. А совпадения при 3 и 4 выборках подтвердили это предположение. Стоит отметить, что разница между e-value лучшей подпороговой и худшей надпороговой находками достаточно велика, а значит можно утверждать, что найденную выборку действитльно составляют гомологи.

Prosite

     Было рассмотрено следующее выравнивание, на основании белка RL1. В банке Prosite был найден один паттерн с идентификатором PS01199 и консенсусной последовательностью [IMGV]-x(2)-[LIVA]-x(2,3)-[LIVMY]-[GAS]-x(2)-[LMSF]- [GSNH]-[PTKR]-[KRAVG]-[GN]-x-[LIMF]-P-[DENSTKQPRAGVI].
Более строгий паттерн: [MAT]-M-x-[LIV]-V-G-x-L-G-[KQ]-[IV]-L-G-P-R-GN-[LM]-M-P-N-P-K-[LV]-G-T-V-T.
Следующим этапом в банке было найдено 870 хитов в 870 последовательностях. В Uniprot нашлось только 427.
Сравнение дало: TP (пересечение списков) - 422, FP (белки, нашедшиеся паттерном, но не содержащиеся в uniprot) - 448, FN (не найденные паттерном последовательности из uniprot) - 5.




Назад
© Петрова Юлия 2016