Практикум 10
Выбранный белок: P74518 (Ribosome hibernation promotion factor). Функция: Необходим для димеризации активных рибосом 70S в рибосомы 100S в стационарной фазе. 100S рибосомы трансляционно неактивны и иногда присутствуют при экспоненциальном росте. Организм: Synechocystis sp. PCC 6803 (Bacteria; Cyanobacteria; Synechococcales; Merismopediaceae; Synechocystis).
Номер итерации | Число находок выше порога (0,005) | Идентификатор худшей находки выше порога | E-value этой находки | Идентификатор лучшей находки ниже порога | E-value этой находки |
1 | 24 | P33987.1 | 3e-05 | Q65SX3.1 | 4.8 |
2 | 28 | P9WMA8.1 | 3e-06 | Q5K2N3.3 | 0.15 |
3 | 28 | P24694.1 | 2e-20 | Q0BSD5.2 | 0.064 |
4 | 28 | P24694.1 | 2e-20 | Q0BSD5.2 | 0.064 |
Было проведено 4 итерации со стандартными параметрами по банку Swissprot. Как понятно из результатов: выборка стабилизировалась уже на второй итерации. А совпадения при 3 и 4 выборках подтвердили это предположение. Стоит отметить, что разница между e-value лучшей подпороговой и худшей надпороговой находками достаточно велика, а значит можно утверждать, что найденную выборку действитльно составляют гомологи.
Было рассмотрено следующее выравнивание, на основании белка RL1.
В банке Prosite был найден один паттерн с идентификатором PS01199 и консенсусной последовательностью [IMGV]-x(2)-[LIVA]-x(2,3)-[LIVMY]-[GAS]-x(2)-[LMSF]- [GSNH]-[PTKR]-[KRAVG]-[GN]-x-[LIMF]-P-[DENSTKQPRAGVI].
Более строгий паттерн: [MAT]-M-x-[LIV]-V-G-x-L-G-[KQ]-[IV]-L-G-P-R-GN-[LM]-M-P-N-P-K-[LV]-G-T-V-T.
Следующим этапом в банке было найдено 870 хитов в 870 последовательностях. В Uniprot нашлось только 427.
Сравнение дало: TP (пересечение списков) - 422, FP (белки, нашедшиеся паттерном, но не содержащиеся в uniprot) - 448, FN (не найденные паттерном последовательности из uniprot) - 5.