Учебная страница курса биоинформатики,
год поступления 2017
Факультатив по машинному обучению
Рекомендованная литература:
Deep Learning by Ian Goodfellow, Yoshua Bengio, Aaron Courville - книга про глубокое машинное обучение, разобраны почти все идеи из области нейросетей
The Elements of Statistical Learning by Trevor Hastie, Robert Tibshirani, and Jerome Friedman - книга в основном по классическому машинному обучению, одна из лучших
Hands-on Machine Learning with Scikit-Learn, Keras and TensorFlow, Aurélien Géron - хорошая книга с отдельным github под нее (https://github.com/ageron/handson-ml2)
- Machine Learning: a Probabilistic Perspective by Kevin Patrick Murphy
- Pattern Recognition and Machine Learning by Christopher M. Bishop - классическое машинное обучение, местами сложновато
Также вам могут понравиться видео с канала StatQuest
Программа курса
Лекция Машинное обучение. Виды задач, примеры. Машинное обучение в биологии.
Лекция Переобучение, недообучение. Метод k-ближайших соседей. Регрессии. Классификации. Оценка качества модели. Популярные метрики (Accuracy, AUC ROC, AUC PR, MSE, MAE). Разбиение на обучение и тест. Bias-variance tradeoff. Домашняя работа 1 Дедлайн: 23.03.2021, 23:59
Лекция Линейная регрессия. Метод максимального правдоподобия. Градиентный спуск. Стохастический градиентный спуск. Регуляризация. L1, L2. Elastic net. Логистическая. Softmax. Домашняя работа 2 Дедлайн: 30.03.2021, 23:59
Лекция Гиперпараметры. Кросс-валидация. Отбор признаков. Домашняя работа 3 Дедлайн: 06.04.2021, 23:59
Лекция. Метод опорных векторов. SVM. Kernel trick. Домашняя работа 4. Дедлайн: 27.04.2021
Лекция. Снижение размерности, линейный и нелинейные методы. Кластеризация. Домашняя работа 5 Дедлайн: 20.04.2021, 23:59
Лекция. Решающие деревья. Категориальные признаки и работа с ними. Пропущенные значения и работа с ними. Понятие ансамбля и виды ансамблей. Бэггинг и метод случайных подпространств. Случайный лес. Домашняя работа 6 Дедлайн: 30.04.2021, 23:59
Лекция. AdaBoost. Градиентный бустинг. Модификации градиентного бустинга (xgboost, lightgbm, catboost). Блендинг и стекинг. Домашняя работа 7 Дедлайн: до зачета, это дополнительное дз
Лекция Оценка важности признаков в модели. Перестановочный метод. Boruta. SHAP. Домашняя работа 8 Дедлайн: до зачета, это дополнительное дз
Лекция Нейронные сети, PyTorch. Домашняя работа 9
Лекция Сверточные нейронные сети. Применение в биологии
Лекция Улучшение сходимости нейросетей и борьба с переобучением
Лекция. Автоенкодеры. VAE. CVAE
Лекция Рекуррентные нейронные сети. Механизм attention.