С первого семестра у каждого студента есть "своя" бактерия.
В геноме бактерии аннотированы гены белков, указаны координаты первой аминокислоты и стоп кодона. (Первый кодон у генов бактерий не обязательно ATG, бывают и другие.) Тем самым, ограничена область промотора перед геном, примерно 100 п.н. перед стартом трансляции — первым кодоном белка
В этой области расположены такие сигналы. Последовательность Shine-Dalgarno = сайт посадки рибосомы на мРНК. Последоватльности -10 и -35 = сайты посадки сигма-субъединицы РНК-полимеразы для начала транскрипции. Хотелось бы в геноме своей бактерии научиться находить сигналы посадки сигма субъединицы и последоватльности Shine-Dalgarno Хорошо, если есть сервисы, выдающие правдоподобные резуьтаты для вашей бактерии или археи. Хорошо бы проверить их работу. А если нет?
Учтём два обстоятельства. Первое, у прокариот бывает обычно несколько разных сигма субъединиц, узнающих разные последовательности -10 и -35 для бытрого переключения экпрессии белков в ответ на изменение среды. Второе, существование оперонов у бактерий. Полицистронная структура приводит к тому, что не перед каждым геном белка обязан быть сайт посадки сигма субъединицы. Эти обстоятельства затрудняют поиск сигналов. Поэтому предлагается задание-challenge.
Задание
В геноме "своей" бактерии или археи найти основные сигналы, связанные с инициацией транскрипции и/или трансляции. Задание — challenge, поэтому даже отрицательный результат может быть зачтён и оценён, если работа выполнена и результаты использованных методов описаны адекватно.
Методы. MEME для поиска в промоторах сигналов de novo. Fimo для поиска по найденным с помощью MEME PWM матрицам. Для проверки достоверности находок полезно иметь контроль ?— межгенные проемежутки, чтобы сравнить число находок в промоторах и межгенных промежутках.
Пока как-то так. В подсказках напишу, как проверить находки в геномах близкородственных прокариот с помощью построения блочного выравнивания геномов. Есть такая программа у нас.