Сигналы, мотивы, PWM



Информация о белках


Запись Имя записи Имя белка Имя гена Координаты гена Координаты Upstream-региона из 100 нуклеотидов
B2U494 PURT_SHIB3 Formate-dependent phosphoribosylglycinamide formyltransferase purT
SbBS512_E2124
1931693..1932871 1931592..1931692
B2TY52 PURA_SHIB3 Adenylosuccinate synthetase, AMPSase, AdS purA
SbBS512_E4708
4400237..4401535 4400136..4400236
B2TTB0 FOLD_SHIB3 Bifunctional protein FolD folD
SbBS512_E0445
434923..435789 434822..434922
B2TXT2 GUAA_SHIB3 GMP synthase guaA
SbBS512_E2882
complement(2680405..2681982) complement(2681983..2682083)
B2TWJ3 PUR9_SHIB3 Bifunctional purine biosynthesis protein PurH purH
SbBS512_E4498
complement(4206779..4208368) complement(4208369..4208469)
B2U2G3 PURR_SHIB3 HTH-type transcriptional repressor PurR purR
SbBS512_E1857
1699013..1700038 1698912..1699012
B2TXS4 PUR5_SHIB3 Phosphoribosylformylglycinamidine cyclo-ligase purM
SbBS512_E2873
2670921..2671958 2670820..2670920
B2TXQ2 PUR7_SHIB3 Phosphoribosylaminoimidazole-succinocarboxamide synthase purC
SbBS512_E2848
complement(2645378..2646091) complement(2646092..2646192)


Получение последовательностей

Последовательности вырезаны и соединены:

 seqret CP001063.fasta -sbeg 1931592 -send 1931692 -outseq 1.fasta
 seqret CP001063.fasta[4208369:4208469:r]  -outseq 5.fasta
 seqret "*.fasta" 100upstream.fasta
Полученный файл 100upstream.


Поиск мотива

Поиск трёх мотивов на обеих цепях:

 ememe -nmotifs 3 -revcomp 100upstream.fasta

Результаты предсталвены ниже:

Первый мотив

  • Размер = 24
  • Кол-во последовательностей с мотивом = 7
  • Информационное содержание = 23.8 bits
  • Логарифмическое отношение провдоподобия = 115
  • E-value = 1.9e+000

Второй мотив

  • Размер = 13
  • Кол-во последовательностей с мотивом = 7
  • Информационное содержание = 15.4 bits
  • Логарифмическое отношение провдоподобия = 76
  • E-value = 8.7e+002

Третий мотив

  • Размер = 8
  • Кол-во последовательностей с мотивом = 2
  • Информационное содержание = 16.0 bits
  • Логарифмическое отношение провдоподобия = 23
  • E-value = 8.2e+003

Первый два мотива присутствуют в 7 из 8 последовательностей, тогда как тетий - всего в 2. Ни одна из находок не удовляетворяет критерию: e-value < 0.001. Т.о. результаты не надёжны.


© Сурикова Елена 2018