Практикум 9

Факторы транскрипции. Поиск de novo сигналов в ДНК

В данном практикуме выполнялся поиск сингала начала транскрипции (последовательность Shine-Dalgarno или SD) в геноме бактерии Pantoea eucrina. На основе файла с последовательностью генома бактерии, а также файла с аннотацией, взятых из NCBI, c помощью скрипта Масленникова Вячеслава, было получено 3 файла:

1. Группа положительного контроля - для каждого CDS из генома было вырезано 25 нуклеотидов перед старт-кодоном с учетом ориентации цепи. Fasta-файл с последовательностями.

2. Группа отрицательного контроля - для каждого CDS из генома было вырезано 25 нуклеотидов после старт-кодона с учетом ориентации цепи. Fasta-файл с последовательностями.

3. Группа для обучения - здесь были отобраны из группы положительного контроля гены тех белков, которые наиболее консервативны в природе в целом, ожидается найти SD или что-то на нее похожее (выявить паттерн и консенсус для данной бактерии). Fasta-файл с последовательностями.

Поиск с помощью MEME

meme TRAIN.fasta -dna -nmotifs 1 -minw 5 -maxw 10

Был найден один мотив (-nmotifs 1) длиной 5-10 нуклеотидов (-minw 5 и -maxw 10). Полная выдача MEME

Рис. 1. Найденный с помощью MEME мотив.
Рис. 2. Последовательность, комплементарная найденному мотиву.

Можно сделать вывод, что находка значимая, так как значение E-value (5.0e-022) низкое. Паттерн найденного мотива - ATTTGAGGAG.

Поиск с помощью FIMO

С помощью команд FIMO с установленным фильтром незначимых находок был проведен поиск найденного для группы обучения с помощью MEME мотива для двух оставшихся групп следующими командами:

fimo --oc fimo_pos -thresh 0.001 meme_out/meme.txt POSITIVE.fasta

fimo --oc fimo_neg -thresh 0.001 meme_out/meme.txt NEGATIVE.fasta

Выдача FIMO для группы отрицательного контроля

Выдача FIMO для группы положительного контроля

По результатам выдачи оказалось, что среди группы положительного контроля 643 значимые находки, среди группы отрицательного контроля - 59. Исходя из полученных данных можно предположить, что найденный мотив ATTTGAGGAG является аналогом консенсусной SD для бактерии Pantoea eucrina.