УЧЕБНЫЙ САЙТ АРТЕМА МУРАВЛЕВА

Практикум 8

ЗАДАНИЕ ВЫПОЛНЕНО СОВМЕСТНО С МИХАИЛОМ ПОПОВЫМ

Задание 1. Описание сигнала(oriC)

В процессе репликации есть абсолютно неоходимаю начальная стадия - инициация репликации. В ходе инициации белковые коплексы связвыают определенные части последовательностей нуклеиновой кислоты - точки начала репликации.

Как правило, для прокариот такая точка одна на одну молекулу н.к. (хоромосому).
В данном практикуме рассмотрим бактериальную точку инициации репликации - OriC - описанную на модельном организме Escherichia coli. По длине - 245 нуклеотидов, имеет две функциональные области: часть, специфично связывающаяся с DnaA (фактор инициации репликации), и часть первичного расплетания ДНК [1].

Область связывания DnaA состоит из нескольких 9-членных повторов [2]:

  • DnaA-боксы - 5 штук, у каждого разная аффинность к DnaA; самые сильные сигналы: R1, R4, R2; консенсус: [TTATNCACA];
  • I-сайты - 3 штуки, несильно отличаются по последовательности от DnaA-боксов; слабее DnaA-боксов;
  • Также есть два сайта связывания гистоноподобных белков - IHF (integration host factor) и Fis (factor for inversion stimulation) - при связывании белков изгибают ДНК.
  • Область первичного расплетания ДНК DUE (DNA unwinding element) состоит из трёх АТ-богатых 13-членных повтора, консенсус: [GATCTNTTNTTTT]. Связывается комплексом DnaA-ATP перед инициацией.

    Вдобавок ко всему этому OriC содержит 13 палиндромных сайтов метилирования GATC по N6-положению аденина. Для инициации репликации требуется метилированность обеих цепей [2].

    10
    Рис. 1. Схема строения точки начала репликации OriC у Escherichia coli. R1-R5 - DnaA-боксы; I1-I3 - I-боксы; IHF - integration host factor; Fis - factor for inversion stimulation; DUE (DNA unwinding element) - область первичного расплетания ДНК. Источник: [2] Figure 1 a.

    Задание 2. Описание сервиса DoriC

    DoriC 12.0 – база данных прокариотических ориджинов. В основном в бд хромосомы, но есть и плазмиды. В DoriC можно искать по собственным DoriC ID, RefSeq ID, таксономии. Также можно искать ориджины с помощью BLAST(на ввод подается нуклеотидная последовательность)

    У записей есть так называемые первичная и вторичная страницы. На первичной странице есть описание молекулы ДНК(хромосома, топология, организм, уровень сборки, размер хромосомы, GC-состав и т.д.). Также отображается график z-curve(особый график, позволяющий отобразть содержание всех типов нуклеотидов с их расположением в молекуле ДНК), содержащий информацию о расположении ориджина, плотности расположения DnaA-box,

    Во вторичной записи об ориджине содержится его идентификатор DoriC; идентификаторы молекулы ДНК, к которой он принадлежит; длину ориджина; AT-содержание ориджина; положение ориджина в молекуле ДНК; карту ориджина(с положением различных элементов(например сайтов посадки DnaA)); последовательность ориджина(с аннотацией); описание содержащихся повторяющихся мотивов; распределение различных генов и типов нуклеотидов между лидирующей и отстающей цепями и прочее.

    Задание 3. Поиск ориджина

    Искали ориджин поиском по таксономии(а именно выбранную Муравлевым А. в 1 семестре бактерию Teredinibacter purpureus). Выдалось две записи, выбрали запись с уровнем сборки Complete(ORI97024506). В записи(на первичной странице) нашли соответствующий ориджин

    Ориджин расположен в хромосоме длиной в 4643613 нуклеотида. Координаты ориджина – [869872:870591]. На Рис.1 показана z-curve и отображение плотности расположения DnaA-боксов и ориджина с некоторой дополнительной информацией.

    Ошибка
    Рис.1 | Z-curve(трехмерный график распределения в последовательности различных нуклеотидов, который однозначно задает эту последовательность(здесь в виде двумерных проекций)) хромосомы Teredinibacter purpureus и отображение расположения DnaA-боксов, индикаторных генов, ориджина и точки терминации репликации

    Ориджин имеет длину в 720 нуклеотидов, есть три различных представленных повторяющихся мотива.

    На Рис.2 представлена карта ориджина с функциональными элементами и график, который отображает вероятность изменения вторичной структуры ДНК для каждой пары оснований. Видно два крупных пика, правый, судя по последовательности, совпадает с АТ-богатым участком, где, вероятно, и происходит плавление ДНК.

    Ошибка
    Рис.2 | График вероятности изменения вторичной структуры и карта ориджина (сюда входят вероятности плавления цепи при определенных условиях, возможность перехода из B- в Z-форму, полученные методом Stress-Induces Duplex Destabilisation), предсказывая таким образом область последовательности, которая потенциально может являться DUE. Также на графике представлены предсказанные сайты Fis, IHF, DnaA-боксы, ATP-DnaA-боксы

    Также мы решили проверить, найдется ли правильно ориджин в какой-либо последовательности с помощью встроенного BLAST. Для этого в BLAST сервиса загрузили последовательность хромосомы Teridinibacter turnerae из соответствующей сборки. Сервис сработал правильно, со 100% совпадением нашлись только два ориджина(ORI97076196 и ORI97024506), принадлежащие Teredinibacter purpureus.