Практикум 9. Поиск регуляторных сигналов в геноме Methanocaldococcus jannaschii
Я изучал геном своей археи Methanocaldococcus jannaschii с первого курса и пытался найти регуляторные сигналы — те, что отвечают за запуск транскрипции и трансляции.
Что делалось
- Извлекли последовательности промоторов и межгенных областей
- Искали повторы и мотивы с помощью MEME (поиск без заранее известных шаблонов)
- Сканировали найденные PWM по геному с помощью FIMO
- Оценили статистическую значимость сигналов (тест Фишера)
- Построили логотипы мотивов (визуальное представление PWM)
Что нашли
- Мотив 1: RAARARRWWDWWRARGADRWW — скорее всего, один из вариантов Shine–Dalgarno, богат пуринами, найден почти в каждой последовательности
- Мотив 2: WGGWGADA — классический Shine–Dalgarno, точно перед старт-кодоном
- Мотив 3: длинный и редкий, возможно, часть архейного BRE или TATA-бокса
Как это выглядит
А вот логотип для вручную собранного PWM Shine–Dalgarno:
Что показала статистика?
Сравнили количество хитов в промоторах и в контрольных регионах:
- Мотив 2 и ручной Shine–Dalgarno однозначно обогащены в промоторах (p-value < 0.01)
- Мотив 3 оказался редким и статистически невыразительным
Выводы
- Shine–Dalgarno-сигнал найден и подтверждён как по позиции, так и по статистике
- MEME справился с задачей даже без заданных PWM
- Ручной PWM Shine–Dalgarno дал сильную валидацию и красиво лег в районе –7 н.п.
- Сигналы транскрипции (например, TATA) встречаются гораздо реже и не так стабильны в археях