Учебная страница курса биоинформатики,
год поступления 2020
Colabfold
Вам предстоит работать в ColabFold. Расчет занимает некоторое время (до получаса), важно не закрывать вкладку и чтобы компьютер не уходил в спящий режим.
Вам предстоит запустить AlphaFold для различных проблемных случаев, с которыми алгоритм справляется не всегда успешно. У данного домашнего задания несколько вариантов. Обязательно сделать один. На дополнительные баллы можно сделать ещё один. Ваш логин нужно занести в таблицу напротив выбранного варианта.
A. Amyloids
Сделайте 3 запуска ColabFold. В первом предскажите структуру мономера. Во втором запуске предскажите структуру из 5 молекул. В третьем запуске предскажите структуру из 10 молекул. Опишите результаты предсказаний. Получилось ли AlphaFold предсказать структурные особенности амилоидов? Найдите в банке PDB структуры для ваших последовательностей. Выглядят ли они похоже на результаты предсказания AF? Насколько, на ваш взгляд, можно обобщить полученные вами результаты?
B. Helices
Вам даны seqA, seqB, seqC. В чем отличия между последовательностями? Сделайте предсказание для seqA. Изучите результат. Где относительно структуры seqA локализованы отличия от seqB и seqC? Какое влияние этих отличий на структуру вы ожидаете? Сделайте предсказания для seqB и seqC. Какие структуры предсказал AlphaFold? Соответствуют ли его предсказания вашим ожиданиям? Насколько реалистичны сделанные им структуры? Насколько, на ваш взгляд, можно обобщить полученные вами результаты?
C. Proteases
Вам дан UNIPROT ID протеазы и сиквенс ее субстрата из базы протеаз !MEROPS (там этот субстрат отмечен как физиологически релевантный). Используйте возможности ColabFold для предсказания комплекса. Вставьте последовательность вашего фермента в поле query_sequence, после чего вбейте разделитель ":" и за ним – последовательность субстрата. Получилось ли AlphaFold предсказать релевантный комплекс фермент-субстрат? Как должен был бы располагаться субстрат в активном центре этой протеазы? Опираться можно на литературные данные. Насколько, на ваш взгляд, можно обобщить полученные вами результаты? Можно ли использовать AlphaFold для задачи предсказания комплексов протеаз с субстратами? Какие контроли можно поставить для проверки универсальности ваших выводов?
D. Deletion
Вам дано две последовательности, seqA и seqB. Вторая – это первая с Н-концевой делецией. Предскажите структуры для обеих независимо. Как устроена структура белка без делеции? Правдоподобна ли структура белка с делецией? Есть ли подозрительные участки в этой структуре? Насколько, на ваш взгляд, можно обобщить полученные вами результаты? Какие контроли можно поставить для проверки универсальности ваших умозаключений и выводов?