Профили, сигналы и эволюционные домены

Вернуться на страницу семестра

Сигналы, мотивы, PWM

Цель задания: поискать с помощью программы MEME сайт связывания транскрипционного фактора, регулирующего синтез пуринов у одной из гаммапротеобактерий.
Я работаю с бактерией Pseudomonas aeruginosa. Мнемоника - PSEAI.

Таксономия: 
› cellular organisms
   › Bacteria
     › Proteobacteria
       › Gammaproteobacteria
         › Pseudomonadales
           › Pseudomonadaceae
             › Pseudomonas
               › Pseudomonas aeruginosa group
Аннотированных записей с ключевым словом "Purine biosynthesis" в Uniprot нашлось 31.
Среди штаммов этой бактерии я выбрала PSEAE (Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1), для которого аннотировано 13 белков.

Таблица 1. Белки транскрипционного фактора, регулирующего синтез пуринов у PSEAE

EntryEntry nameProtein namesGene namesCoordinatesUpstream-region
Q9I2U6FOLD_PSEAEBifunctional protein FolD folD PA1796complement(1946187..1947041)complement(1947042..197141)
Q9HXP3PURT_PSEAEFormate-dependent phosphoribosylglycinamide formyltransferasepurT PA3751complement(4203324..4204505)complement(4204506..4204605)
Q9HUM6PURA_PSEAEAdenylosuccinate synthetase, AMPSase, AdSS, EC 6.3.4.4purA PA4938complement(5542073..5543365)complement(5543366..5543465)
Q9HXN2PUR4_PSEAEPhosphoribosylformylglycinamidine synthase, FGAM synthase, FGAMS, EC 6.3.5.3purL PA3763complement(4215544..4219440)complement(4219441..4219540)
Q51342PUR1_PSEAEAmidophosphoribosyltransferase, Atase, EC 2.4.2.14purF PA3108complement(3488409..3489914)complement(3489915..3490014)
P72158PURK_PSEAEN5-carboxyaminoimidazole ribonucleotide synthase, N5-CAIR synthase, EC 6.3.4.18purK PA5425complement(6105159..6106241)complement(6106242..6106341)
Q9HXM6GUAA_PSEAEGMP synthase [glutamine-hydrolyzing], EC 6.3.5.2guaA PA3769complement(4225660..4227237)complement(4227238..4227337)
Q9I0K9PUR8_PSEAEAdenylosuccinate lyase, ASL, EC 4.3.2.2purB PA26292972699..29740692972599..2972698

В ENA я скачала Sequence: AE004091.2 - это полный геном Pseudomonas aeruginosa PAO1.
Для каждого из генов выбранных белков в скачанной записи EMBL найден ген и записаны координаты Upstream-региона из 100 нуклеотидов (то есть 100 нуклеотидов с 5'-стороны от статового кодона гена). Данные занесены в таблицу 1.
С помощью скрипта я вырезала нужные области и занесла в fasta-файл.
На кодомо была запущена программа MEME так, чтобы поиск производился на обеих цепях ДНК и программа выдавала 3 различных мотива (команда: ememe upstream_regions.fasta meme -nmotifs 3 -revcomp)
Результат программы - html-файл meme.
Видим, что все 3 мотива имеют e-value > 0.001 (наименьшее это 3.7e+002), что говорит о небольшой достоверности. E-value первого мотива наименьший, потому что он встретился во всей подборке белков, но видим, что консервативность мала. Остальные 2 мотива консервативны, но встретились лишь в 2 последовательностях.





© Миронова Екатерина 2018 год