Практикум 9. Поиск de novo сигналов в ДНК

Последовательность Шайна-Дольгарно.

Сигнал Шайна-Дольгарно — это короткая консенсусная последовательность в мРНК прокариот, которая взаимодействует с комплементарной областью 16S рРНК при инициации трансляции.

В данном практикуме работа проводилась с бактерией Rickettsia asiatica.

Цель данного практикума найти потенциальные сайты связывания рибосом (Shine-Dalgarno) в 5'-областях генов (промоторах), используя MEME Suite (MEME и FIMO), и оценить статистическую значимость находок с использованием контрольной выборки — межгенных участков.

1.Подготовка промоторных регионов и межгенных участков

Из NCBI были скачаны FASTA и GFF3 файлы для Rickettsia asiatica

Участки промоторных регионов(50-100 нуклеотидов перед старт-кодоном (ATG) всех генов) и межгенные регионы в качестве контрольной группы(такой же длины, как промоторные регионы) из генома бактерии Rickettsia asiatica были выделены с помощью скрипта, доступного по ссылке

2. Поиск мотивов de novo с помощью MEME

Был выполнен с помощью следующей команды:

meme promoters.fa -dna -mod zoops -nmotifs 5 -minw 4 -maxw 12 -oc meme_results

Ссылка на выдачу

Ссылка на выдачу meme в формате txt

Рис 1. Выдача MEME

Было найдено пять мотивов, Logo которых представлены на рисунке 1. Им соответствуют E-value, равные 7.5e-174, 2.9e-163, 6.7e-103, 1.5e-095, 2.1e-034.

К сожалению, не получилось найти мотивы, которые были бы очень похожи на последовательность Шайна-Дольгарно, например у Escherichia coli - AGGAGGU.

Риккетсии — внутриклеточные паразиты с редуцированным геномом, поэтому вероятно, что их SD-последовательность менее консервативна, чем у свободноживущих бактерий.

Выдача FIMO(в формате tsv) доступна по ссылкам: промоторные области, контроль

К сожалению, статистически значимых находок, которые бы втречались приемущественно в промоторных областях найти не удалось.