Сигналы, мотивы, PWM


Задание 1

В данном практикуме у меня был организм Vibrio parahaemolyticus serotype O3:K6 (strain RIMD 2210633).
В таблице 1 показ список ,tkrjd, которые я использовал для выполнения этого практикума.
Таблица 1. Отобранные белки
Идентификатор Мнемоника Название белка Ген Координаты Координаты Upstream region
Q87Q53 PURT_VIBPA Formate-dependent phosphoribosylglycinamide formyltransferase purT complement(1376818..1377993) complement(1377994-1378094)
P40607 PURA_VIBPA Adenylosuccinate synthetase purA complement(2975587..2976903) complement(2976904 - 2977004)
Q87RB8 FOLD_VIBPA Bifunctional protein FolD folD complement(911485..912345) complement(912346 - 912446)
Q87KE0 PURK_VIBPA N5-carboxyaminoimidazole ribonucleotide synthase purK 3244219..3245352 3244118 - 3244218
Q87QW9 PURR_VIBPA HTH-type transcriptional repressor PurR purR complement(1079009..1080013) complement(1080014 - 1080114)
Q87MH0 PUR5_VIBPA Phosphoribosylformylglycinamidine cyclo-ligase purM 2393407..2394447 2393306 - 2393406
Q87KE1 PURE_VIBPA N5-carboxyaminoimidazole ribonucleotide mutase purE 3243729..3244214 3243628 - 3243728
Q87Q87 PUR7_VIBPA Phosphoribosylaminoimidazole-succinocarboxamide synthase purC complement(1337584..1338687) complement(1338688 - 1338788)


IMG SRC="PICTURES/logo1.png" width="90%" После этого с помощью "descseq" последовательности Upstream-регионов были вырезаны и собраны файл
После этого была запущена программа "MEME" для поиска мотивов. Результат работы тут.
Лого Число сайтов E-value
  22 1.8e-007
  11 2.1e+003
  8 1.1e+00


Все три мотива имеют E-value менее 0,001. Можно заметить, что ни одного мотива не предствленно в каждом гене.Хотя третий мотив является самым коротким из всех 3ех, он самый редкий из всех - в 2 из 8 генов, хотя 1 и 2 второй встречаются в 7 из 8.

© Угольков Ярослав, 2018