Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2021

Практикум 6: задания

Отчёт по этому заданию выкладывается на сайт со ссылкой со страницы семестра. Срок без потери баллов — 31 марта 2023. Срок со штрафом 0,5 балла — 7 апреля 2021.

1. Кратко опишите один интересный сигнал, закодированный в геноме

В описании укажите:

  1. В чем состоит сигнал
  2. Кому адресован
  3. Предназначение - как должен реагировать адресат
  4. Эффективность сигнала:
  5. высокоэффективен если (почти) каждый раз адресат реагирует на сигнал
  6. низко эффективен если адресат не всегда реагирует на сигнал
  7. Любые использованные источники:
    • может сталкивались в курсовой или других мол.-биол. активностях своих или знакомых
    • литература и интернет

Что оценивается:

2. Для одного из сигналов, заданного выравниванием нуклеотидных последовательностей, постройте PWM и оцените результаты поиска по этой PWM новых сайтов

Этапы

  1. Выберите тип сигнала из предлагаемых ниже или любой другой
    1. [Kozak]Окрестность ATG кодона - старта транскрипции в геноме человека
    2. [Kozak]Окрестность ATG кодона - старта транскрипции в геноме другого млекопитающего
    3. [SD] Последовательность Шайна-Далгарно перед стартом трансляции генов в геноме штамма E.coli
    4. [SD] Последовательность Шайна-Далгарно перед стартом трансляции генов в геноме бактерии другого вида
    5. [XXX] Любой другой тип сигнала, для которого можно набрать более десятка известных последовательностей
  2. [материал обучения] Составьте выравнивание (без гэпов) последовательностей сигнала для построения PWM.
  3. [материал тестирования]Соберите последовательности, в которых ожидается наличие сигнала
  4. [материал негативного контроля] Соберите последовательности, в которых не должно быть сигнала. Число последовательностей удобно взять равным числу последовательностей в п.3
  5. Постройте PWM на материале обучения.
  6. Вычислите веса для всех последовательностей из п.п. 2, 3 и 4.
  7. Выберите порог веса, выше которого находка считается правильной. Для этого постройте гистограммы весов из п.п. 2, 3 и 4.
  8. Представьте результат: PWM, гистограммы весов, таблицу 2х3 результатов проверки. Столбцов три соответствуют выборкам 2, 3, и 4. Строк две: сигнал(+), сигнал(-). В ячейке число последовательностей
  9. Напишите выводы

На выходе нужно получить

4. Посчитать число сайтов GAATTC в полном геноме одного штамма E.coli

Определите на сколько и в какую сторону оно отличается от ожидаемого по статистике, достоверно ли отличие.

2021/4/task6 (последним исправлял пользователь aba 2023-03-28 12:32:44)