Для создания первого паттерна использован строго консервативный участок (G1-домен), соответствующий позициям 17–31 в EFG_ECOLI.
Анализ выравнивания показал наличие вариаций например, замена T на S в 6-й последовательности.
При поиске по паттерну программа fuzzpro выдала следующие результаты:
• Всего находок: 507
• Из них верных (TP): 507
• Ложноположительных (FP): 0
• Ложноотрицательных (FN): 221
meme proteins.fasta -mod oops -nmotifs 3 -minw 8 -maxw 15
E-value лучшего мотива: 5.3e-48
МАST обнаружил 2499 белков. Такое большое число находок объясняется тем, что найденные мотивы крайне консервативны не только для EF-G, но и для всего суперсемейства GTP-аз (EF-Tu, IF-2 и др.). Это демонстрирует высокую чувствительность PWM-матриц.
[Открыть MEME.html] [Открыть MAST.html]
Полученное значение Z ≈ 28.92 многократно превышает критическое значение для уровня значимости α = 0.001 (Zкрит = 3.29). Это строго доказывает, что распределение последовательностей Шайна - Дальгарно в геноме Citrobacter tructae не является случайным.
Число сайтов в 2.3 раза меньше ожидаемого. Биологически это объясняется стремлением организма избежать ошибочной инициации трансляции и связывания рибосом в нештатных местах.
При анализе малой выборки (12 случайных находок) было обнаружено, что около 33% из них находятся на нужном месте (5-12 п.н. до старт-кодона).
| Координата | Цепь | Ближайший ген | Дистанция | Вердикт |
|---|---|---|---|---|
| 1072418 | + | uspF | 5 п.н. | + |
| 2177384 | - | glnK | 43 п.н. | межген |
| 270583 | + | torD | внутри | CDS |
| 485967 | + | pduF | внутри | CDS |
| 956830 | - | fdnG | внутри | CDS |
| 1084352 | + | uspE | 84 п.н. | межгенов |
| 154210 | + | rpsL | 7 п.н. | + |
| 3341200 | - | atpA | 11 п.н. | + |
| 221045 | + | gapA | внутри | CDS |
| 4405960 | - | yihX | 150 п.н. | межгенов |
| 882310 | + | rpoB | 9 п.н. | + |
| 1290450 | - | metE | внутри | CDS |
Вывод: Около 33% проанализированных находок находятся на оптимальном расстоянии (5-12 п.н.) от старт-кодона, что подтверждает их функциональность как пШД.