Учебная страница курса биоинформатики,
год поступления 2019
Семестр 5. Язык R и анализ данных
Полезные ссылки
Ведомость - пока актуальны только первичные баллы
Занятия
1. 3.09.2020: Введение. RStudio. Markdown. Вектор - операции, создание, срезы. Data frame. Помощь
Домашнее задание 1 - Дедлайн 19 сентября в 23:59
2. 10.09.2020: which. Полезные функции. Сохранение и чтение данных. Работа с отсутствующими данными. Факторы. Матрицы. Списки. Циклы
Домашнее задание 2 - Дедлайн 28 сентября в 23:59
3. 17.09.2021: tidyverse - tibble, dplyr, stringr
Домашнее задание 3 - Дедлайн 14 октября в 23:59
4. 24.09.2021: tidyverse - forcats, ggplot2, readr
Домашнее задание 4 - Дедлайн 10 октября в 23:59
5. 1.10.2021: Функции, map, join
Домашнее задание 5 - Дедлайн 20 октября в 23:59
6. 8.10.2021: Полезные графики, heatmap. Подготовка к контрольной работе.
Домашнее задание 6 - Дедлайн 23 октября в 23:59
7. 15.10.2021: Классы. S3, S4, S6. Статистические тесты в R.
8. 22.10.2021: Контрольная работа 1
9. 29.10.2021: 10. 02\03.11.2020 Корреляция. Линейная регрессия.
Презентация (на слайде 39 опечатка, R^2 - квадрат коэффициента корреляции Пирсона)
Домашнее задание, Rmd, Дедлайн - 17.11.2021, 23:59.
10. Множественное тестирование. Линейная регрессия. Конфаундеры.
11. Методы понижения размерности. PCA. TSNE. UMAP Квиз - https://forms.gle/mgLvxLTjjPzEdQtR6
Домашнее задание, Rmd, Дедлайн - 12.12.2021, 23:59.
Форма для сдачи 12. 26.11.2021: Дифференциальная экспрессия
13. 03.12.2021: Контрольная
14. 10.12.2021
Функциональная аннотация генов
Работа с геномными интервалами
Разнообразная визуализация геномных и не только данных на Python (!!!)
15. 17.12.2021
РНК-секвенирование единичных клеток
16. 24.12.2021: Зачет
Прикрепите код c отчетом и презентацию - Прислать код с отчетом (pdf\html) и презентацию (pdf) не позднее 23.12.2021 (15:00 !!!)
В проекте должно быть:
- краткое описание и устройство вашего набора данных (сколько наблюдений, есть ли пропущенные значения, каковы характеристики наблюдений, ...)
- формулировка гипотезы, которую вы хотите проверить; тест, который вы применили; выводы (гипотез должно быть как минимум 2, но не однотипных, используйте по максимуму информацию из блока 2)
- меньше текста - больше осмысленных картинок! подкрепите ваш рассказ визуализацией (рисунков как минимум 2, не однотипных)
ВСЕ подписи, значения и текст должны быть читаемы(!!!)
Время презентации - 3 минуты + вопросы! Не более 2 слайдов.
Вопросы могут касаться данных, корректности применения статистики, кода, описания рисунков, а также в целом по программе курса.