Вернуться на страницу семестра
Сигналы, мотивы, PWM
Цель задания: поискать с помощью программы MEME сайт связывания транскрипционного фактора, регулирующего синтез пуринов у одной из гаммапротеобактерий.
Я работаю с бактерией Pseudomonas aeruginosa. Мнемоника - PSEAI.
Таксономия:
› cellular organisms
› Bacteria
› Proteobacteria
› Gammaproteobacteria
› Pseudomonadales
› Pseudomonadaceae
› Pseudomonas
› Pseudomonas aeruginosa group
Аннотированных записей с ключевым словом "Purine biosynthesis" в Uniprot нашлось 31.
Среди штаммов этой бактерии я выбрала PSEAE (Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1),
для которого аннотировано 13 белков.
Таблица 1. Белки транскрипционного фактора, регулирующего синтез пуринов у PSEAE
Entry | Entry name | Protein names | Gene names | Coordinates | Upstream-region |
Q9I2U6 | FOLD_PSEAE | Bifunctional protein FolD | folD PA1796 | complement(1946187..1947041) | complement(1947042..197141) |
Q9HXP3 | PURT_PSEAE | Formate-dependent phosphoribosylglycinamide formyltransferase | purT PA3751 | complement(4203324..4204505) | complement(4204506..4204605) |
Q9HUM6 | PURA_PSEAE | Adenylosuccinate synthetase, AMPSase, AdSS, EC 6.3.4.4 | purA PA4938 | complement(5542073..5543365) | complement(5543366..5543465) |
Q9HXN2 | PUR4_PSEAE | Phosphoribosylformylglycinamidine synthase, FGAM synthase, FGAMS, EC 6.3.5.3 | purL PA3763 | complement(4215544..4219440) | complement(4219441..4219540) |
Q51342 | PUR1_PSEAE | Amidophosphoribosyltransferase, Atase, EC 2.4.2.14 | purF PA3108 | complement(3488409..3489914) | complement(3489915..3490014) |
P72158 | PURK_PSEAE | N5-carboxyaminoimidazole ribonucleotide synthase, N5-CAIR synthase, EC 6.3.4.18 | purK PA5425 | complement(6105159..6106241) | complement(6106242..6106341) |
Q9HXM6 | GUAA_PSEAE | GMP synthase [glutamine-hydrolyzing], EC 6.3.5.2 | guaA PA3769 | complement(4225660..4227237) | complement(4227238..4227337) |
Q9I0K9 | PUR8_PSEAE | Adenylosuccinate lyase, ASL, EC 4.3.2.2 | purB PA2629 | 2972699..2974069 | 2972599..2972698 |
В ENA я скачала Sequence: AE004091.2 - это полный геном Pseudomonas aeruginosa PAO1.
Для каждого из генов выбранных белков в скачанной записи EMBL найден ген и записаны координаты Upstream-региона из 100 нуклеотидов (то есть 100 нуклеотидов с 5'-стороны от статового кодона гена). Данные занесены в таблицу 1.
С помощью скрипта я вырезала нужные области и занесла в fasta-файл.
На кодомо была запущена программа MEME так, чтобы поиск производился на обеих цепях ДНК и программа выдавала 3 различных мотива (команда: ememe upstream_regions.fasta meme -nmotifs 3 -revcomp)
Результат программы - html-файл meme.
Видим, что все 3 мотива имеют e-value > 0.001 (наименьшее это 3.7e+002), что говорит о небольшой достоверности. E-value первого мотива наименьший, потому что он встретился во всей подборке белков, но
видим, что консервативность мала. Остальные 2 мотива консервативны, но встретились лишь в 2 последовательностях.
Источники
|