PSI-BLAST

Для выполнения данного задания был выбран идентификатор белковой последовательности - P74518 - Ribosome hibernation promotion factor - фактор гибернации рибосомы, который стимулирует и стабилизирует димеризацию 70S рибосом во время стационарной фазы, приводя к образованию инактивированных 100S рибосом.

Результаты PSI-BLAST

Номер итерации Число находок выше порога (0,005)Идентификатор худшей находки выше порогаE-value этой находкиИдентификатор лучшей находки ниже порогаE-value этой находки
124P33987.13e-05Q65SX3.14.8
228P9WMA8.13e-06Q5K2N3.30.15
328P24694.12e-20Q0BSD5.20.065
428P24694.12e-20Q0BSD5.20.15

После проведения 3 итераций результат стабилизировался. Разница между лучшей находкой ниже порога и худшей находкой выше порога около 18 порядков. Это достаточно значительная разница. Значит, полученную выборку можно считать семейством гомологичных белков.

Prosite

Для задания было использовано семейство 30S рибосомных белков S2. Поиск проводился по ID RS2_SALTY. Было найдено два паттерна:
PS00962, координаты в белке 6-17

MRDMLKAGVHFG

Консенсусная формула:
[LIVMFA]-x-{GPRV}-[LIVMFYC](2)-{LPC}-[STAC]-[GSTANQEKR]-[STALV]-[HY]-[LIVMF]-G

PS00963, координаты в белке 158-182
PDALFVIDADHEHIAIKEANNLGIP

Консенсусная формула:
P-x(2)-[LIVMF](2)-[LIVMS]-x-[GDN]-x(3)-[DENL]-x(3)-[LIVM]-x-E-x(4)-[GNQKRH]-[LIVM]-[AP]

Для дальнейшей работы был взят первый паттерн PS00963

С помощью выравнивания была получена более строгая формула паттерна:

M-R-[DEQ]-[ML]-[LI]-[QEK]-A-G-V-H-F-G-H-Q-T-R

Паттерн увеличился на 4 позиции.

При сравнении с "правильными" данными было выявлено очень много ложноположительных результатов, почти в половину болше чем реально положительных, а ложноотрицательных наоборот было очень мало.

TPFPFN
37066834
Ссылка на Exel файл

©Шкарина Анастасия Николаевна 2016