Поиск сигналов

I

Были выданы сайты связывания транскрипционного фактора MurR для бактерий семейства Staphylococcaceae. При помощи веб-сервиса MEME был определён мотив связывания этого транскрипционного фактора. Был найден мотив AAWTGWAAWHTTWTTACAAT с e-value 1.3 * 10—9 (pwm). Вот его лого:

При помощи веб-сервиса Tomtom были найдены несколько похожих мотивов (23), из них лучший — это мотив транскрипционного фактора IscR в группе Rickettsiales (e-value находки — 5.38 * 10—2). PWM мотива найденного транскрипционного фактора в базе находится неочевидно, гораздо проще сделать его заного при помощи того же веб-сервиса MEME по имеющемуся на сайте выравниваниювот получившаяся позиционно-весовая матрица. Вот выравнивание двух лого:


Видно, что мотивы похожи (например, 4 последних нуклеотида или несколько первых), однако есть и различия, особенно в центре выравнивания. В принципе, это можно объяснить, например, тем, что белок-фактор — контактирует непосредственно только с концевыми участками данного мотива (и по сути сигналом являются лишь они, центральные нуклеотиды важны лишь для количества). Вообще, найденный в базе данных мотив получен по трём последовательностям сайтов связывания, что не вызывает доверия к его особой достоверности.

Используя сервис FIMO (база данных Upstream Sequenses: Prokaryotic), был совершён поиск найденного в пункте 1 задания мотива в апстримных участках генома бактерии Staphylococcus aureus N315 uid57837. Результаты выдачи FIMO. Находок было всего 215, после более-менее разумного фильтра по q-value (результаты с q-value > 0.4 были отфильтрованы) осталось всего 8 участков. При поиске мотива мы ограничились только апстримными участками по причине того, что исследуемый нами мотив — это мотив связывания транскрипционного фактора, который помогает инициации транскрипции (как-то взаимодействует с полимеразой в промоторной области), и логично, что сайт связывания с этим фактором будет находиться в районе начала гена (чуть выше или, возможно, чуть ниже, что бывает реже).

Функции известны только для четырёх из восьми этих генов — это

  • sarA — транскрипционный регулятор с какой-то невообразимой тучей функций, которые могут зависеть даже от штамма;
  • recU — резолваза (разрешает структуры Холидея);
  • glcA — транспортный белок, участвует в транспорте глиголят-ионов с одной стороны мембраны на другую;
  • fmhB — белок, участвующий в биосинтезе пептидогликанов клеточной стенки.
Как видно, связи между белками практически нет, или если они и есть, то какие-то совершенно надуманные. В один метаболический путь KEGG эти белки тоже не вовлечены.

II

См. эту часть работы здесь.