Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2018

Практикум 7

1. Мини КР

Выполняется только на занятии. Если не написана, то вопрос на коллоквиуме Выбор варианта:

2. Вычислите информационное содержание (IC) последовательностей Козак в геноме данио рерио и постройте LOGO этого сигнала

Дано выравнивание десятка контекстов ATG для десятка белков из статьи Grzegorski et al., PLoS ONE 9(9): e108475, 2014.

Выбор варианта: 1 2 3 4 5 6 7 8 9 10

Выполняется на занятии. Крайний срок сообщения о выполнении - 20 марта до 23:59.

Запись в очередь обязательна. Нужна ссылка на файл с результатом: матрицей с информационными содержаниями отдельных букв и колонок; итоговое информационное содержание сигнала; формула для вычисления элемента матрицы, картинка LOGO. И, конечно, минимальный связный текст с объяснениями. Формат - Word, google doc или html страница.

Сервис для LOGO: Google ли сайт, указанный на стр. 36 презентации Лекции практикума 6.

При зачете задания засчитывается соответствующая тема коллоквиума.

3. Проверка PWM для сайтов регуляции разрывной транскрипции sgmRNA

"Идеальный" результат мотива по коронавирусу

  1. Прочитайте каков идеальный мотив. Стремитесь приблизиться к идеалу. b. Опишите находки сигнала, заданного PWM, созданной в задании 4 практикума 6, в геноме того самого коронавируса, в котором вы нашли мотив PWM. Используйте программу FIMO пакета MEME c. Постройте LOGO для последовательностей Козак поздних генов вашего коронавируса. Сравните его с известными LOGO для последовательностей Козак генов человекаю
    • Замечание. Может случиться, что мРНК поздних генов содержат другие ATG до инициаторного ATG гена. В таком случае, постарайтесь объяснить, почему эти посторонние ATG не используются для инициации трансляции.
    d. Выполните b. для двух других геномов коронавирусов. Один возьмите из того же вида коронавирусов, другой штамм. Другой - из другого, но близкородственного вида согласно таксономии.

Пункты b. и c. могут служить для обоснования правильности вашего мотива.

Пункт d. может объяснить насколько найденный сигнал специфичен для вида.


Дополнительные (не обязательные) задания

4. Придумайте p-value для сигналов синтеза субгеномных мРНК используя свойства таких сигналов

Вот у вас есть мотив, заданный PWM. И находки сигналов в геноме коронавируса, своего или чужого, все равно.

Вычислите информационное содержание мотива (MEME выдает), грубо оцените число случайных находок мотива.

Один из упрощающих вариантов - из выравнивания сигналов написать консенсус или паттерн, описывающий выравнивание. И использовать это описание мотива для поиска сигналов.

Начальное предложение такое: вычислите вероятность найти слово определенной длины (например, 6; но зависит от ИС мотива) такое, что все встречи слова в геноме распределены по участкам генома, как в идеальном распределении сигналов (описано по ссылке выше); или как ваши сигналы - если они распределены не идеально.

Можно использовать упрощающие задачу предположения.

5. Найти мотив для сайта посадки рибосомы, Shine-Dalgarno последовательности, в геноме "своей" бактерии

Результат должен быть представлен на сайте. Должен включать:

Ссылки на выдачу программы не принимаются!

Будьте добры, разберитесь с выдачей; выберите то, что нужно, и представьте в отчете на своем сайте.

ААл