Учебный сайт Титовой Анастасии
ГЛАВНАЯ СТРАНИЦА
СЕМЕСТРЫ
ОБО МНЕ
КОНТАКТЫ
САЙТ ФББ
Мотивы в белках. PSSM и паттерны. PSI-BLAST. Банк Prosite

Задание 1. PSI-BLAST

AC: P17265

Фактор гибернации рибосомы, необходимый для димеризации 70S рибосом до инактивированных 100S рибосом в стационарной фазе.[1]

Ниже приведена таблица итераций, полученных в результате работы PSI-BLAST.

Таблица 1. Итерации.
Номер итерации Число находок выше порога (0,005) Идентификатор худшей находки выше порога E-value этой находки Идентификатор лучшей находки ниже порога E-value этой находки
1 24 P33987.1 3e-05 Q65SX3.1 4.8
2 28 P9WMA8.1 3e-06 Q5K2N3.3 0.15
3 28 P24694.1 2e-20 Q0BSD5.2 0.064
4 28 P24694.1 2e-20 Q0BSD5.2 0.15

Как видно из таблицы, четвертое итерирование имеет тот же результат, что и третье. Низкие значения E-value свидетельствуют о высокой консервативности паттернов в этом семействе белков.

Задание 2. PROSITE

Поиск производился по семейству белков RL1.

Цель задания: уточнить паттерн одного из семейств белков так, чтобы он описывал не все белки данного семейства, а только белки протеобактерий. Для получения более точного результата было выполнено выравнивание белков всех 18 бактерий. Ниже приведено это выравнивание, выполненное с помощью "muscle", с раскраской "Identity" с порогом 100% (для определения абсолютно консервативных позиций).


Рис. 1. Выравнивание белковых последовательностей выбранных бактерий
Ribosomal protein L1 signature Далее с помощью Prosite[2] был найден следующий паттерн у RL1_ECOLI:
[IMGV]-x(2)-[LIVA]-x(2,3)-[LIVMY]-[GAS]-x(2)-[LMSF]-[GSNH]-[PTKR]-[KRAVG]-[GN]-x-[LIMF]-P-[DENSTKQPRAGVI]
Рис. 1. Найденный с помощью PROSITE паттерн
На основании выравнивания исходный паттерн был сделан более строгим:
M-x-[LIV]-V-G-x-L-G-x-[LIV]-L-G-P-R-x(2)-M-P-N
Как видно из выравнивания, полученный паттерн окружен несколькими абсолютно консервативными колонками, которые были добавлены к новому паттерну. Новый паттерн представлен на рисунке 2.
Рис. 2. Найденный паттерн
A-[ST]-P-D-x-M-x-[LIV]-V-G-x-L-G-x-[LIV]-L-G-P-R-x(2)-M-P-N-P-K-V-G-T-V-T
По строгому паттерну в Prosite был найден список AC белков, содержащих данный паттерн (поиск по Swissprot) - 373 белка. На сайте Uniprot были найдены белки RL1, относящиеся к протеобактериям - 427 белков. Далее с помощью средств Excel были найдены пересечения полученных множеств. Интересно то, что количество находок по обоим строгим паттернам полностью совпали. Результаты работы.

Обозначения:

    TP - True positives (пересечение множеств)
    FP - False positives (нашлись только в Prosite)
    FN - False negatives (содержатся только в списке протеобактерий)

Результаты представлены в таблице 2.
Таблица 2. Результаты
TP FP FN
289 84 138

Источники:

[1]: Uniprot. P17265

[2]: PROSITE

[3]:


Titova Anastasiya, 2018 ©