В ходе данного практикума был осуществлен поиск сигналов (последовательность Shine-Dalgarno)
в промоторных областях генома бактерии Aquibium oceanicum.
Геномная последовательность Aquibium oceanicum была загружена.
Также был взят файл аннотации этой хромосомы .gff (использована ссылка из
миниобзора с первого курса).
Затем был использован Operon-mapper для предсказания координат оперонов в геноме.
На вход программа получила оба файла. Был установлен параметр для поиска только оперонов.
Всего было предсказано 2811 оперонов.
Рис. 1. Диалоговое окно для использования Operon-mapper
После долгих 7 минут Operon-mapper что-то предсказал: выдал список оперонов.
Рис. 2. Выдача Operon-mapper
На основе полученных результатов
из последовательности хромосомы были вырезаны части промоторных участков
длиной в 40 нуклеотидов (прямо перед старт-кодоном), так как
последовательность Шайна-Дальгарно находится на расстоянии примерно 10 нуклеотидов.
400 полученных последовательностей
были использованы в качестве обучающей выборки,
а 600 в качестве тестовой.
Для отрицательного контроля были получено ещё 600 последовательностей
межгенных промежутков (также длиной 40 нуклеотидов).
Все последовательности выбирались случайно и не пересекаются.
Кстати, сначала я забыл, что надо смотреть на какой цепи находится оперон,
но потом исправил этот момент!
Данные операции были выполнены с помощью
скрипта.