Учебный сайт Вероники Мурашка


За код благодарю Георгия Муравьева

Практикум 7

В этом практикуме я обратилась к геному бактерии Acidaminococcus intestini, с которой уже работала в прошлом году. Из генбанка я скачала два файла: fasta-файл генома и список генов. С помощью сервиса Operon-mapper я получила файл, содержащий список оперонов. Далее я запустила скрипт Python, который создал три файла:
  • Материал обучения - 50 промоторов оперонов генов домашнего хозяйства
  • Материал тестирования
  • Материал отрицательного контроля - случайные последовательности генома той же длины (100 нуклеотидов)
  • MEME

    Дальше я попросила MEME найти 3 мотива

    meme housekeeping.fasta -dna -mod zoops -nmotifs 3 -minw 6 -maxw 50 -maxsites 50

    LOGO находки 1

    LOGO находки 2

    LOGO находки 3

    Один из них (первый) очень похож на последовательность Шайна — Дальгарно, с ним я продолжила работать.

  • Выдача MEME в текстовом формате: meme.txt
  • FIMO

    Я дважду запустила FIMO: сначала для материала тестирования, потом - для материала отрицательного контроля, чтобы поискать там мою последовательность

    fimo --norc -motif GDAAGGAGG -thresh 0.001 meme.txt promotors.fasta
    fimo --norc -motif GDAAGGAGG -thresh 0.001 meme.txt negative.fasta

    Полученная выдача: promotors_fimo.tsv, negative_fimo.tsv

    Среди промоторов я получила 717 находок, среди отрицательного контроля - 28.