Учебная страница курса биоинформатики,
год поступления 2019
Ассорти задач
Практикум не обязателен для зачета. Вы можете использовать задачи, чтобы набрать баллы.
Foldseek -- топологический или нет?
Изучите на практике, является ли инструмент поиска по структурному сходству Foldseek топологическим или нетопологическим. Возьмите любой белок в качестве query. Сделайте его версию с круговой перестановкой (или найдите в базе PDB пару таких белков). Проведите поиск по обоим, изучите результаты, сделайте вывод.
Справляется ли AlphaFold/ESMFold с круговыми перестановками?
AlphaFold опирается на выравнивания. Для искусственного белка, который является круговой перестановкой от природного, построение выравниваний будет затруднено, так как быстрые инструменты типо MMseqs2 не позволяют делать разрывные выравнивания. Скажется ли это на качестве работы AlphaFold? И справится ли лучше ESMFold, которому не нужно выравнивание? Подберите объекты, проверьте.
Справляется ли ESMFold с проблемными случаями?
На странице прошлого года есть задание с AlphaFold и проблемными случаями. Некоторые из них интересно проверить с ESMFold (интересно все, но для некоторых нужна функциональность мультимера, а ESM так делать еще не умеет):
- предсказание эффекта очевидно портящей альфа-спираль одиночной замены на пролин (B. Helices)
- Н-концевая делеция по бета-тяжу (D. Deletion)
- Структура белка-метаморфы (E. Metamorph)