Для практического задания был выбран участок oriC — сайт инициации репликации в кольцевых хромосомах большинства бактерий. Его длина варьируется от ~250 до 2000 нуклеотидов, при этом первичная структура сильно различается между видами. Несмотря на вариабельность, сохраняются общие принципы организации: последовательность содержит множественные мотивы, распознаваемые белками, контролирующими начало репликации. В качестве модельного объекта использован штамм Escherichia coli K-12 MG1655, для которого функционально важные элементы oriC детально описаны и локализованы в интервале 3 923 767–3 923 998 н. о. [1]
Функционально участок можно разделить на три компонента:
Таким образом, oriC представляет собой многофакторный регуляторный модуль, точное распознавание которого белками-компонентами инициационного аппарата необходимо для своевременного и единичного запуска репликации. Нарушение структуры или экспрессии любого из адресатов сигнала снижает скорость роста и увеличивает частоту летальных событий, что подчеркивает высокую селективную значимость данного участка.
Я решил рассмотреть геном [3] Salmonella enterica, которая принадлежит к тому же семейству Enterobacteriaceae и является популярным модельным объектом. Координаты ориджина репликации не указаны, но я нашел ген mioC (4084179-4084622) и gidA (4081911-4083800), а судя по исследованиям это практически достоверный знак того, что координаты oriC будут в этом промежутке.
Для нахождения ориджина репликации я использовал сервис Ori-Finder [4], который позволяет достаточно достоверно находить точку начала репликации прокариот, а также предоставляет различные средства визуализации результата.
В результате работы алгоритма можно видеть, он нашел два предполагаемых ориджина репликации, однако, исходя из предыдущих рассуждений, практически наверняка искомым является второй (4083801-4084178), длина ориджина — 378 нуклеотидов. Интересно, что сервис определил координаты mioC с точностью до нуклеотида, вероятно, потому что я взял популярный референсный геном.
Сервис строит Z-кривую исходя из GC, AT, MK, RY составов. Как можно видеть, два предполагаемых ориджина находятся в минимуме GC-состава, что согласуется с теорией.
Выводы:
Список литературы