Практикум 9.

1.Факторы транскрипции. Поиск de novo сигналов в ДНК.

Моя бактерия из первого семестра - Erwinia amylovora CFBP1430. В ходе практикума я пыталась найти сигналы начала транскрипции, последовательность Shine-Dalgarno sequence, Shine-Dalgarno box — сайт посадки рибосом на молекуле мРНК прокариот.

С помощью скрипта моего однокурсника Масленникова Вячеслава(спасибо ему большое) было создано 3 набора последовательностей:

  • Файл с последовательностью размером 25 нуклеотидов перед старт-кодоном (с учетом ориенации цепи).
  • Файл с последовательностью в 25 нуклеотидов после старт-кодона (с учетом ориенации цепи).
  • Файл c группой для обучения, гены наиболее консервативных белков.
  • MEME

    На основании созданного файла TRAIN для обучения с MEME я искала мотив похожий на SD следующей командой:

    meme TRAIN.fasta -dna -nmotifs 1 -minw 5 -maxw 10

    Рис. 1Найденный с помощью MEME мотив.
    Рис. 2Последовательность, комплементарная найденному мотиву.

    Из Находка является статистически значимой (низкий E-value = 9.3e-002).Паттерн найденного мотива: CAGGA.

    FIMO

    С помощью FIMO я искала мотив(найденный для группы обучения с помощью MEME) для обеих групп контроля командами:

    fimo --oc fimo_pos -thresh 0.001 meme_out/meme.txt POSITIVE.fasta

    fimo --oc fimo_neg -thresh 0.001 meme_out/meme.txt NEGATIVE.fasta

    Параметр -thresh для фильтрации незначимых находок (p-value < 0.001)

    FIMO для группы положительного контроля.

    FIMO для группы отрицательного контроля.

    Для группы отрицательного контроля было найдено 163 последовательности с p-value < 0.001, что составляет около 4% от общего числа, для группы положительного контроля 422 значимые находки(~11%). Можно сделать вывод, что сигнал достаточно слабый для Erwinia amylovora.