Учебная страница курса биоинформатики,
год поступления 2018
Проекты на большое количество дополнительных баллов
DSSP in Python
Сколько лет прошло, но все так же... алгоритм DSSP всеми используется в виде бинарника. Biopython и prody при разметке вторичной структуры вызывают отдельно установленный DSSP и потом считывают его аутпуты. Это не дело! Даешь DSSP на чистом Python!
Есть референс на C++.. Для получения 10 баллов прошу вас написать питоническую версию и снабдить этот вариант хорошими комментариями и подготовить презентацию с разбором.
За выполнение: 10 баллов
Bonus: если выполнен, снимается требование выполнять практикум по разметке вторичных структур и за него автоматически начисляется максимум баллов.
Взято: Иосифом Финкельбергом
Фурье в Google Colab
Переведите задание прака 4, иллюстрирующее нюансы синтеза Фурье для реконструкции ЭП, в ноутбук на Google Colab. Сделайте удобные ползунки и формы инпута для генерации молекулы, выбора шума, набора гармоник.
За выполнение: 5-10 баллов
Экспонированности остатков
Соберите статистику по экспонированности остатков со всего PDB (не забыв сделать отсев для достижения неизбыточности).
За выполнение: 5-15 баллов
Интерактивный Рамачандран
Сделайте веб-страничку, на которой можно визуализировать карту Рамачандрана для любого остатка/группы остатков по полному PDB (с и без фильтрации для неизбыточности выборки). Данные также должно быть можно скачать в виде матрицы чисел.
За выполнение: 5-15 баллов
Алгоритм на Python
Реализуйте один из классических алгоритмов, разбираемых на лекциях, на Python в Google Colab. Главная ценность - образовательная, т.е. это должен быть не просто код, а, условно, глава учебника. Варианты: DOMAK, Detective, Swindells, динамическое программирование для совмещения структур, Combinatorial Extension, ...
За выполнение: 5-15 баллов
Внутренняя простота структур
Предположим следующее безумство: мы пропускаем структуру биомолекулы через аутоэнкодер с латентным слоем размера X, наш лосс – RMSD. Как будет зависеть средний RMSD от размера латентного слоя? Для упрощения будем рассматривать только остов и сгенерируем неизбыточную выборку структур с одинаковой длиной последовательности (лишнее с краев будем просто выбрасывать).
За выполнение: 30 баллов
Туториал по PyMol API
Можно реализовать автоматизацию многих задач по анализу структурных данных, пользуясь встроенными в PyMol функциями и при этом не вызывая его графическую оболочку. Для этого существует Pymol API. Напишите понятное и полное описание действий по использованию API для нужд структурного биоинформатика.
За выполнение: 10 баллов
Исследовательский кейс от Евгения Шеваля
Нуклеокапсидные белки низко патогенных и высоко патогенных коронавирусов человека различаются по аминокислотным последовательностям. Но определяют ли эти различия свойства нуклеокапсидных белков и влияют ли эти различия на патогенность остается непонятным. Можно ли предположить, какие последствия имеют эти различия?
За выполнение: 1-20 баллов
Исследовательский кейс от Сергея Дмитриева
Известна кристаллическая структура фрагмента гетеродимера человеческих белков MCTS1 и DENR (https://www.rcsb.org/structure/6MS4, MCTS1 там полный, а от DENR – относительно небольшой фрагмент). Выясните, какие взаимодействия обуславливают связывание этих белков.
Попробуйте разобраться, есть ли у этих белков структурные и функциональные ортологи, способные образовывать димер, в следующих видах архей:
Halobacterium salinarum
Methanococcus jannaschii
Saccharolobus solfataricus
Pyrococcus horikoshii
За выполнение: 1-20 баллов
Взято: Верой Сидоровой
Pattern recognition?
Может ли задача расположения водородов и разметки взаимодействий быть формализована как задача unsupervised/self-supervised learning? Напишите “грантовую заявку” на исследование такой возможности. Воспользуйтесь шаблонами любых грантовых заявок на ваш вкус (РНФ, РФФИ, ERC, NIH), чтобы сделать текст структурированным и знать, какие вопросы нужно осветить.
За выполнение: 1-20 баллов