Главная страница О себе ФББ МГУ

PSI-BLAST

Для работы взял идентификатор P47908. Он соответствует белку Ribosome hibernation promotion factor, кодируемому геном HPF, из организма Synechococcus sp. (цианобактерия). Он димеризует 70S рибосомы в 100S синтетически неактивные рибосомы (чаще всего во время экспоненциального роста бактерий). Транскрипция этого гена подавляется светом. Поэтому этот белок встречается только у клеток, живущих в темноте. Подавление синтеза этого белка требует другого специфичного белка, связанного с Irta световой репрессией

Таблица 1. Итерации PSI-BLAST.

Номер итерацииЧисло находок выше порога (0,005)Идентификатор худшей находки выше порогаE-value этой находкиИдентификатор лучшей находки выше порогаE-value этой находки
16B3FK34.19.7P19172.24.4
218Q5V4R5.18.9Q3IPW6.10.44
316A0JMQ7.16.1I3ZNU9.10.12
417A5U9Q7.17.9I3ZNU9.10.12
518Q9XCA9.19.9I3ZNU9.10.081
622A5U9Q7.19.7I3ZNU9.10.079

После третьей итерации не обнаружилось новых белков с E-value ниже порогового значения. Худшие (по E-value) находки после 4, 5, 6 итерации менялись местами из-за небольших различий в E-value, а лучшая находка не изменилась (стабилизация результата).

После 6-ой итерации в допороговых находках оказались: 24 белка Ribosome hibernation promotion factor, 1 Ribosome-binding factor PSRP1 (ингибирует трансляцию, предотвращая связывание t-RNA), 1 Ribosome-associated inhibitor A (подавляет образование 100S), 1 Ribosome-associated factor Y (подавляет образование 100S), 1 Dormancy associated translation inhibitor.

Prosite

Во втором практикуме я работал с пептидил-тРНК гидролазой (мнемоника PTH) из восьми видов протеобактерий(один представитель гаммапротеобактерий, три - бетапротеобактерий, четыре - альфапротеобактерий).

Искал паттерн на сайте Prosite с запросом в Quick scan: PTH_ECOLI. Нашлось 2 паттерна: PS01195 и PS01196. Для дальнейшей работы выбрал PS01196.

Консенсус паттерна: [GS]-x(3)-H-N-G-[LIVM]-[KR]-[DNS]-[LIVMTC]. Позиция: 110-120.

Рисунок 1. Фрагмент выравнивания с паттерном.

Устрожение паттерна

Паттерн для данного выравнивания по позициям (114)116-126: (G-G-)G-x-[GNA]-G-H-N-G-[IL]-[KR]-[DS]-[ITL].
Добавлены 2 консервативные колонки слева (в скобочках).

Поиск белков по устроженному паттерну

Ссылка на файл с идентификаторами белков.(318)

Запрос в Uniprot для поиска всех AC белков пептидил-тРНК гидролазы из Proteobacteria:
mnemonic:pth_* taxonomy:"Proteobacteria [1224]"

Ссылка на файл.(388)

Скриптом на Python нашел:

Малое число FP говорит о том, что добавление к паттерну двух консервативных колонок на основании 8 последовательностей не сильно повлияло на специфичность поиска. Большое число FN объясняется тем, что паттерн был устрожен и часть белков не нашлась из-за более жестких условий поиска.


© Кирпичиков Роман, 2017