Учебная страница курса биоинформатики,
год поступления 2022
UNDER CONSTRUCTION
Практикум 8: задания
Отчёт по этому заданию выкладывается на сайт со ссылкой со страницы семестра. Срок без потери баллов — 20 апреля 2024. Срок со штрафом 0,5 балла — 27 апреля 2024.
1. Кратко опишите один сигнал, закодированный в геноме
Включает литературную составляющую и демонстрацию примеров сигнала
Варианты предложены в пояснениях, можно и приветствуется взять другой
В описании укажите:
- Название сигнала
- В чем состоит сигнал
- Кому адресован
- Предназначение - как должен реагировать адресат
- Силу сигнала (можно высказать гипотезу)
- Примеры сигнала
- Использованные источники
Что оценивается:
- понятность, логичность, простота и краткость описания;
- интересность, необычность сигнала или его кодировки.
2. Для одного из сигналов в геноме найдите последовательности представителей, постройте PWM и оцените результаты поиска по этой PWM новых сайтов
Этапы
- Выберите тип сигнала из предлагаемых ниже или любой другой
- [Kozak]Окрестность ATG кодона - старта транскрипции в геноме человека
- [Kozak]Окрестность ATG кодона - старта транскрипции в геноме другого зверя
- [Kozak]Окрестность ATG кодона - старта транскрипции в геноме бактерии или археи
- [SD] Последовательность Шайна-Далгарно перед стартом трансляции генов в геноме штамма E.coli
- [SD] Последовательность Шайна-Далгарно перед стартом трансляции генов в геноме бактерии другого вида
- [XXX] Любой другой тип сигнала, для которого можно набрать более десятка известных последовательностей
- [материал обучения] Составьте выравнивание (без гэпов) последовательностей сигнала для построения PWM.
- [материал тестирования]Соберите последовательности, в которых ожидается наличие сигнала
- [материал негативного контроля] Соберите последовательности, в которых не должно быть сигнала. Число последовательностей удобно взять равным числу последовательностей в п.3
Постройте PWM на материале обучения. В BioPython есть такой метод. Использовать его можно.Но на коллоквиуме всё равно придется ответить про PWM
- Вычислите веса для всех последовательностей из п.п. 2, 3 и 4.
- Выберите порог веса, выше которого находка считается правильной. Для этого постройте гистограммы весов из п.п. 2, 3 и 4.
- Представьте результат: PWM, гистограммы весов, таблицу 2х3 результатов проверки. Столбцов три соответствуют выборкам 2, 3, и 4. Строк две: сигнал(+), сигнал(-). В ячейке число последовательностей
- Вычислите информационное содержание IC выравнивания
- Постройте LOGO. LOGO можно построить используя сервис WebLOGO 3. Ссылка стоит в подсказках.
- Напишите выводы
3. Вычислите информационное содержание сигнала из задания 2, и постройте Logo
На выходе нужно получить
4. Посчитать число сайтов GAATTC в полном геноме одного штамма E.coli
Определите на сколько и в какую сторону оно отличается от ожидаемого по статистике, достоверно ли отличие.