Герб ФББ
  • Главное
  • Семестры
  • Обо мне
  • Официальный сайт ФББ МГУ

    Практикум 9. Факторы транскрипции. Поиск de novo сигналов в ДНК


    Моей бактерией, которую я выбрала в 1 семестре, является Coxiella burnetii RSA 493 (NCBI RefSeq assembly: GCF_000007765.2)

    Файл с последовательностью генома бактерии

    GFF-файл с аннотацией ORF

    В данном практическом задании необходимо найти сигналы начала транскрипции (последовательность Shine-Dalgarno) в геноме моей бактерии Coxiella burnetii RSA 493. Я воспользовалась скриптом (с разрешения автора), который на основе файла с последовательностью генома бактерии и GFF-файла с аннотацией создает 3 файла:

    1. POSITIVE.fasta - это последовательности размером 25 нуклеотидов перед старт-кодоном с учетом ориентации цепи.
    2. NEGATIVE.fasta - это последовательности в 25 нуклеотидов после старт-кодона с учетом ориентации цепи.
    3. TRAIN.fasta - это гены наиболее консервативных белков, то есть связанных с трансляцией и т.п.

    Поиск с помощью MEME

    Для того чтобы провести поиск с помощью MEME воспользуюсь командой, которая находит в обучающей выборке (TRAIN.fasta) единственный мотив длиной от 5 до 10 нуклеотидов:

    meme TRAIN.fasta -dna -nmotifs 1 -minw 5 -maxw 10

    Выдача команды: html, txt

    Выдача blast
    Рис. 1. Мотив, найденный с помощью MEME.

    При этом E-value = 7.5e-003, что меньше чем 0,01, а значит находку можно считать значимым. Выявленный паттерн найденного мотива: TTTTTGGAG. Паттерн найденного мотива не на все 100% соотвествует консенсусу (AGGAGG), но схож с ним.

    Поиск с помощью FIMO

    Далее я решила выполнить поиск мотива, обнаруженного в обучающей группе с помощью MEME, в двух других группах данных с использованием следующих команд:

    fimo --oc fimo_pos -thresh 0.001 meme_out/meme.txt POSITIVE.fasta

    fimo --oc fimo_pos -thresh 0.001 meme_out/meme.txt NEGATIVE.fasta

    В командах я задала параметр -thresh, чем определила p-value < 0.001 для находок.

    Выдача FIMO для POSITIVE.fasta

    Выдача FIMO для NEGATIVE.fasta

    Исходя из результатов выдачи FIMO выяснилось, что среди групп положительного контроля значимых находок 143, а среди группы негативного контроля 69 значимых находок. Полученные результаты позволяют предположить, что идентифицированный мотив TTTTTGGAG может выполнять функцию, аналогичную консенсусной Shine-Dalgarno последовательности у бактерии Coxiella burnetii RSA 493.