Задание 1. PSI-BLAST
AC: P17265
Фактор гибернации рибосомы, необходимый для димеризации 70S рибосом до инактивированных 100S рибосом в стационарной фазе.[1]
Ниже приведена таблица итераций, полученных в результате работы PSI-BLAST.
Таблица 1. Итерации. |
Номер итерации |
Число находок выше порога (0,005) |
Идентификатор худшей находки выше порога |
E-value этой находки |
Идентификатор лучшей находки ниже порога |
E-value этой находки |
1 |
24 |
P33987.1 |
3e-05 |
Q65SX3.1 |
4.8 |
2 |
28 |
P9WMA8.1 |
3e-06 |
Q5K2N3.3 |
0.15 |
3 |
28 |
P24694.1 |
2e-20 |
Q0BSD5.2 |
0.064 |
4 |
28 |
P24694.1 |
2e-20 |
Q0BSD5.2 |
0.15 |
Как видно из таблицы, четвертое итерирование имеет тот же результат, что и третье. Низкие значения E-value
свидетельствуют о высокой консервативности паттернов в этом семействе белков.
Задание 2. PROSITE
Поиск производился по семейству белков RL1.
Цель задания: уточнить паттерн одного из семейств белков так, чтобы он описывал не все белки данного семейства, а только белки протеобактерий.
Для получения более точного результата было выполнено выравнивание белков всех 18 бактерий.
Ниже приведено это выравнивание, выполненное с помощью "muscle", с раскраской "Identity" с порогом 100% (для определения абсолютно консервативных позиций).
|
Рис. 1. Выравнивание белковых последовательностей выбранных бактерий |
Ribosomal protein L1 signature
Далее с помощью Prosite
[2] был найден следующий паттерн у RL1_ECOLI:
[IMGV]-x(2)-[LIVA]-x(2,3)-[LIVMY]-[GAS]-x(2)-[LMSF]-[GSNH]-[PTKR]-[KRAVG]-[GN]-x-[LIMF]-P-[DENSTKQPRAGVI]
![](pattern2.png) |
Рис. 1. Найденный с помощью PROSITE паттерн |
На основании выравнивания исходный паттерн был сделан более строгим:
M-x-[LIV]-V-G-x-L-G-x-[LIV]-L-G-P-R-x(2)-M-P-N
Как видно из выравнивания, полученный паттерн окружен несколькими абсолютно консервативными колонками, которые были добавлены к новому паттерну.
Новый паттерн представлен на рисунке 2.
![](newpattern.png) |
Рис. 2. Найденный паттерн |
A-[ST]-P-D-x-M-x-[LIV]-V-G-x-L-G-x-[LIV]-L-G-P-R-x(2)-M-P-N-P-K-V-G-T-V-T
По строгому паттерну в Prosite был найден список AC белков, содержащих данный паттерн (поиск по Swissprot) -
373 белка.
На сайте Uniprot были найдены белки RL1, относящиеся к протеобактериям -
427 белков.
Далее с помощью средств Excel были найдены пересечения полученных множеств. Интересно то, что количество находок по обоим строгим паттернам полностью совпали.
Результаты работы.
Обозначения:
TP - True positives (пересечение множеств)
FP - False positives (нашлись только в Prosite)
FN - False negatives (содержатся только в списке протеобактерий)
Результаты представлены в таблице 2.
Таблица 2. Результаты |
TP |
FP |
FN |
289 |
84 |
138 |
Источники:
[1]: Uniprot. P17265
[2]: PROSITE
[3]: