Учебная страница курса биоинформатики,
год поступления 2019
Задания практикума 7
Задание миниконтрольной
Дано: длина генома бактерии, GC-состав генома и (a) слово (b) паттерн
Вычислите: ожидаемое число встреч указанного слова (a) и паттерна (b) в случайным образом перемешанной последовательности указанной бактерии.
Варианты будут выданы на занятии
Примеры слова: CTAG, паттерна: GWGCNC
Обозначения подмножеств нуклеотидов см презентации Л1 или в интернете. Например, W = {A, T}
7.1. Вычислите информационное содержание (IC) последовательностей Козак и постройте LOGO этого сигнала
Дано выравнивание десятка контекстов ATG для десятка белков Danio rerio из статьи Grzegorski et al., PLoS ONE 9(9): e108475, 2014.
Выбор варианта: 1 2 3 4 5 6 7 8 9 10
Выполняется на занятии. Крайний срок сообщения о выполнении - 27 марта до 15:00. Работы присланные после deadline но до 23:59 воскр. 28го проверяются с вычетом 1 балла.
При записи в очередь выбрать 7.1. Нужна ссылка на файл с результатом: матрицей с информационными содержаниями отдельных букв и колонок; итоговое информационное содержание сигнала; картинка LOGO; одну фразу, характеризующую силу сигнала. Из представленных данных проверяющий должен иметь возможность проверить примененную форму!
Сервис для LOGO: Web LOGO 3
При зачете задания засчитывается соответствующая тема коллоквиума.
7.2a Найти сайты разрывной транскрипции sgmRNA в геноме своего коронавируса, используя PWM из задания 6.2
"Идеальный" результат мотива по коронавирусу
Литература Grossoehme et al., 2009
- Прочитайте каков идеальный мотив. Стремитесь приблизиться к идеалу.
- Опишите находки сигнала, заданного PWM, созданной в задании 2a практикума 6, в геноме того самого коронавируса, в котором вы нашли мотив PWM. Используйте программу FIMO пакета MEME
- Постройте LOGO для последовательностей Козак поздних генов вашего коронавируса. Сравните его с известными LOGO для последовательностей Козак генов человека.
- Замечание. Может случиться, что мРНК поздних генов содержат другие ATG до инициаторного ATG гена. В таком случае, постарайтесь объяснить, почему эти посторонние ATG не используются для инициации трансляции.
- Выполните b. для двух других геномов коронавирусов. Один возьмите из того же вида коронавирусов, другой штамм. Другой - из другого, но близкородственного вида согласно таксономии.
Пункты b. и c. могут служить для обоснования правильности вашего мотива.
Пункт d. может объяснить насколько найденный сигнал специфичен для вида.
7.2b. Найдите сайты посадки рибосомы, SD последовательности, в геноме "своей" бактерии с помощью PWM, построенной в задании 6.2
- "Своя" - та которая была дана в первом семестре.
Результат должен быть представлен на сайте. Должен включать:
Построенный вами профиль (PWM) для последовательности Шайн – Дальгарно (ШД) в вашем геноме
Список кодирующих последовательностей, перед которыми предсказывается Шайн – Дальгарно, найденный сигнал с указанием числа нуклеотидов между ШД и 1м кодирующим нуклеотидом (выходной файл FIMO в формате Excel с добавленным расстоянием до старта трансляции).
- Гистограмму расстояний до старта трансляции
- Лого найденных сигналов.
- Процент генов белков, перед которыми найден ШД.
- Данные из литературы или из БД о ШД в вашем геноме. Ссылки обязательны! Если ничего не смогли разыскать, то опишите как искали.
- Короткое обсуждение результата
Ссылки на выдачу программы не принимаются!
Будьте добры, разберитесь с выдачей; выберите то, что нужно, и представьте в отчете на своем сайте.