Задание 1. PSI-BLAST

Был выбран идентификатор: (AC:P19954)

Данный белок относиться к 30S рибосомальным белкам. Фактор связывания PSRP1, локализован в хлоропластах. Выделен из организма Spinacia oleracea (шпинат огородный).
Номер итерации Число находок выше порога (0,005) Идентификатор худшей находки выше порога E-value этой находки Идентификатор лучшей находки ниже порога E-value этой находки
1 106 A9I8C3.1 5e-05 B9JRA7.1 5e-05
2 16 P17265.2 2e-07 P30334.1 0.004
2 16 P17265.2 2e-07 P30334.1 0.004


В результате итераций удалось стабилизировать результат. При второй итерации значительно улучшилось качество находок. Как видно есть существенная разница между самой лучшей после порога и самой худшей выше порога. При этом количество находок выше порога было оптимальным. Для подтверждения стабильности результата была проведена еще одна итерация с измененными параметрами. Результаты были идентичны, что позволило утверждать о стабильности данных

Задание 2.
Поиск был проведен поиск по: RS4_SALTY(Salmonella typhimurium) Название в Prosite: RIBOSOMAL_S4, PS00632 Ribosomal protein S4 signature
Найденный паттерн: [LIVM]-[DERA]-x-R-[LI]-x(3)-[LIVMC]-[VMFYHQL]-[KRTS]-x(3)-[STAGCVF]-x-[ST]-x(3)-[SAI]-[KRQ]-x-[LIVMF]
Выравнивание паттерна (Рис.1)

Рис.1
Более строгий паттерн:
L-E-[GSR]-R-L-D-[NA]-[IV]-V-Y-R-[MA]-[GK]-F-[GV]-[APS]-T-[RVI]-[AF]-[AE]-[SA]-R-Q-[LF]
На сайте Uniprot были найдены белки RS4, относящиеся к протеобактеиям - это правильный список (то есть у всех этих последовательностей предполагается наличие данного паттерна). Было найдено 427 белка.
По более строгому паттерну в Prosite был найден список AC белков, содержащих данный паттерн (поиск по Swissprot) - 180 белков.
TP= 178
FP= 2
FN= 249