I
Были выданы сайты связывания транскрипционного фактора MurR
для бактерий семейства Staphylococcaceae.
При помощи веб-сервиса MEME
был определён мотив связывания этого транскрипционного фактора.
Был найден мотив AAWTGWAAWHTTWTTACAAT
с e-value 1.3 * 10—9 (pwm
). Вот его лого:
При помощи веб-сервиса Tomtom
были найдены несколько похожих мотивов (23), из них лучший — это мотив транскрипционного фактора IscR
в группе Rickettsiales (e-value находки — 5.38 * 10—2). PWM мотива найденного транскрипционного фактора в базе находится неочевидно, гораздо проще сделать его заного при помощи того же веб-сервиса MEME по имеющемуся на сайте выравниванию — вот получившаяся позиционно-весовая матрица. Вот выравнивание двух лого:
Видно, что мотивы похожи (например, 4 последних нуклеотида или несколько первых), однако есть и различия, особенно в центре выравнивания. В принципе, это можно объяснить, например, тем, что белок-фактор — контактирует непосредственно только с концевыми участками данного мотива (и по сути сигналом являются лишь они, центральные нуклеотиды важны лишь для количества). Вообще, найденный в базе данных мотив получен по трём последовательностям сайтов связывания, что не вызывает доверия к его особой достоверности.
Используя сервис FIMO
(база данных Upstream Sequenses: Prokaryotic), был совершён поиск найденного в пункте 1 задания мотива в апстримных участках генома бактерии Staphylococcus aureus N315 uid57837. Результаты выдачи FIMO
. Находок было всего 215, после более-менее разумного фильтра по q-value (результаты с q-value > 0.4 были отфильтрованы) осталось всего 8 участков. При поиске мотива мы ограничились только апстримными участками по причине того, что исследуемый нами мотив — это мотив связывания транскрипционного фактора, который помогает инициации транскрипции (как-то взаимодействует с полимеразой в промоторной области), и логично, что сайт связывания с этим фактором будет находиться в районе начала гена (чуть выше или, возможно, чуть ниже, что бывает реже).
Функции известны только для четырёх из восьми этих генов — это
sarA
— транскрипционный регулятор с какой-то невообразимой тучей функций, которые могут зависеть даже от штамма;recU
— резолваза (разрешает структуры Холидея);glcA
— транспортный белок, участвует в транспорте глиголят-ионов с одной стороны мембраны на другую;fmhB
— белок, участвующий в биосинтезе пептидогликанов клеточной стенки.
KEGG
эти белки тоже не вовлечены.
II
См. эту часть работы здесь.