Для работы взял идентификатор P47908. Он соответствует белку Ribosome hibernation promotion factor, кодируемому геном HPF, из организма Synechococcus sp. (цианобактерия). Он димеризует 70S рибосомы в 100S синтетически неактивные рибосомы (чаще всего во время экспоненциального роста бактерий). Транскрипция этого гена подавляется светом. Поэтому этот белок встречается только у клеток, живущих в темноте. Подавление синтеза этого белка требует другого специфичного белка, связанного с Irta световой репрессией
Таблица 1. Итерации PSI-BLAST.
Номер итерации | Число находок выше порога (0,005) | Идентификатор худшей находки выше порога | E-value этой находки | Идентификатор лучшей находки выше порога | E-value этой находки |
---|---|---|---|---|---|
1 | 6 | B3FK34.1 | 9.7 | P19172.2 | 4.4 |
2 | 18 | Q5V4R5.1 | 8.9 | Q3IPW6.1 | 0.44 |
3 | 16 | A0JMQ7.1 | 6.1 | I3ZNU9.1 | 0.12 |
4 | 17 | A5U9Q7.1 | 7.9 | I3ZNU9.1 | 0.12 |
5 | 18 | Q9XCA9.1 | 9.9 | I3ZNU9.1 | 0.081 |
6 | 22 | A5U9Q7.1 | 9.7 | I3ZNU9.1 | 0.079 |
После третьей итерации не обнаружилось новых белков с E-value ниже порогового значения. Худшие (по E-value) находки после 4, 5, 6 итерации менялись местами из-за небольших различий в E-value, а лучшая находка не изменилась (стабилизация результата).
После 6-ой итерации в допороговых находках оказались: 24 белка Ribosome hibernation promotion factor, 1 Ribosome-binding factor PSRP1 (ингибирует трансляцию, предотвращая связывание t-RNA), 1 Ribosome-associated inhibitor A (подавляет образование 100S), 1 Ribosome-associated factor Y (подавляет образование 100S), 1 Dormancy associated translation inhibitor.
Во втором практикуме я работал с пептидил-тРНК гидролазой (мнемоника PTH) из восьми видов протеобактерий(один представитель гаммапротеобактерий, три - бетапротеобактерий, четыре - альфапротеобактерий).
Искал паттерн на сайте Prosite с запросом в Quick scan: PTH_ECOLI. Нашлось 2 паттерна: PS01195 и PS01196. Для дальнейшей работы выбрал PS01196.
Консенсус паттерна: [GS]-x(3)-H-N-G-[LIVM]-[KR]-[DNS]-[LIVMTC]. Позиция: 110-120.
Рисунок 1. Фрагмент выравнивания с паттерном.
Паттерн для данного выравнивания по позициям (114)116-126: (G-G-)G-x-[GNA]-G-H-N-G-[IL]-[KR]-[DS]-[ITL]. Добавлены 2 консервативные колонки слева (в скобочках).
Ссылка на файл с идентификаторами белков.(318)
Запрос в Uniprot для поиска всех AC белков пептидил-тРНК гидролазы из Proteobacteria: mnemonic:pth_* taxonomy:"Proteobacteria [1224]"
Ссылка на файл.(388)
Скриптом на Python нашел:
Малое число FP говорит о том, что добавление к паттерну двух консервативных колонок на основании 8 последовательностей не сильно повлияло на специфичность поиска. Большое число FN объясняется тем, что паттерн был устрожен и часть белков не нашлась из-за более жестких условий поиска.