Поиск регуляторных мотивов транскрипции в бактериальных последовательностях
В данном занятии я осваивал наык поиска сайтов связывания транскрипционных факторов у прокариот при помощи методов сравнительной геномики с использованием программы MEME.
Для поиска мне был выдан набор промоторных областей генов E. coli и список экспериментально установленных сайтов связывания белка PurR.
В параметрах поиска была выставлена длина мотива равная 16 нуклеотидам. Запуск проводился два раза, в первом случае с параметром "One per sequence", во втором - "Zero or one per sequence".
В качестве результата было получено несколько файлов, содержащих информацию о предсказанных сайтах связывания:
- Параметр "One per sequence" - html-страница отчета, текстовый вариант
- Параметр "Zero or one per sequence" - html-страница отчета, текстовый вариант
Экспериментальные данные и предсказания были отмечены на последовательностях и сохранены в файле compare_results.docx. Для мотивов, найденных на комплементарной цепи, выполнялся поиск обратно-комплементарных им сайтов на исходной последовательности. В файле синим отмечены сайты, установленные экспериментально, курсивом - предсказанные с параметром "One occurence per sequence". В большинстве случаев экспериментальные участки и участки, предсказанные MEME, совпадают с экспериментальными, или отличаются сдвигом на 1 нуклеотид. В случае purA предсказание ошибочно.
Поиск генов из генома бактерии, родственной E.coli, но другого вида, которые, предположительно, регулируются гомологом пуринового репрессора
В качестве объекта исследования была выбрана патогенная бактерия Escherichia albertii KF1. С помощью скрипта, написанного на python (принимающего на вход файл в формате genbank с информацией о расположении генов, файл в формате fasta, содержащий полную последовательность генома бактерии и имя выходного файла), были получены -200 последовательности промоторов первых 300 генов бактерии. Далее с помощью MEME, используя подтвержденные экспериментально сайты связывания пуринового репрессора в качестве контроля были осуществлен поиск участков связывания в этих генах. Полученные результаты - html-страница отчета, текстовый вариант
.Согласно результатам 66 белков из 300 имеют сайты связвания с p-value < 1e-04, 16 - c p-value < 1e-05, 4 - c p-value < 1e-06, что позволяет утверждать, что эти белки могут содержать сайты связывания с гомологом пуринового рецептора.