Рандомно отобранный мотив (рис. 1) внезапно обладает E-value аж -101 порядка. Впрочем, Information Content: 11.9 и Relative Entropy: 11 - не очень большие значения для такой длины посл-ти. Я склонен считать, что мотив получился так себе и обладает высоким E-value только за счёт того, что неоднозначные буквы занимают целый ряд позиций.
Самый значимый по E-value мотив (рис. 2) как будто бы не слишком информативен (Relative Entropy: 15.6) - мало более или менее консервативных букв. Данный мотив представлен почти везде в участке [-100; 0]. Сложно сказать, что это за мотив, и какую он играет роль (если вообще играет).
Второй по значимости мотив (рис. 3) представляет собой высококонсервативный ряд из тимина. У данного мотива относительная энтропия (Relative Entropy: 15.6) ниже, чем у предыдущего варианта - при меньшей длине он несёт ненамного меньше информации (Information Content первого: 16.2; Information Content второго: 14.2).
Последний среди прошедших порог мотивов представлен на рис. 4. Данный мотив характеризуется крайне консервативной (и, как следствие, информативной) подпосл-тью AAGGAG (почти консенсус посл-ти Шайн-Дальгарно - AGGAGG). Если данный мотив действительно является посл-тью Шайн-Дальгарно для моей бактерии, то, видимо, он играет не слишком большую роль.
Впрочем, мне могло просто не повезти с выборкой. Проведём поиск с помощью fimo.
Получили 609 значимых находок. Ожидал находок порядка 10 000. Видимо, данный мотив играет не слишком важную роль в матричных процессах.
Попробуем поискать два других значимых мотива.
Получили 20695 находок мотива (рис. 2).
Получили 998 находок мотива (рис. 3).
Оказалось, что два мотива с наивысшим E-value (SCWGSYSRCSGNVCTGSTGSYCGMCCTG и SSBCYTTTTTTDTKY) наиболее представлены в бактерии Aeromonas allosaccharophila. Мотив MAAGGAGD довольно похож на консенсус посл-ти Шайн-Дальгарно, но он не слишком представлен.