Учебная страница курса биоинформатики,
год поступления 2018
Что может Альфафолд2
4 балла
Продукт, решивший проблему сворачивания белка.
Величайшее достижение искусственного интеллекта.
Технология, перевернувшая игру
Многое из сказанного про AlphaFold2 правда. Генерация гипотез в структурной биологии еще никогда не была так доступна. Помимо полных протеомов модельных организмов, выложенных в открытый доступ, структура любого белка оказывается доступной в течение часа безо всяких собственных ресурсов благодаря проекту ColabFold.
В этом практикуме мы предлагаем вам попробовать самим запустить ColabFold. При планировании работы учтите, что один запуск может занять до получаса, и в практикуме может быть нужно сделать до 3 запусков.
Выбор кейса
Занесите ваш логин в таблицу напротив выбранного кейса.
Описание кейсов
Во всех вам предстоит работать в ColabFold. В течение самого расчета от вас ничего не требуется, можно на 20 минут уйти заниматься другими делами. Оставьте вкладку открытой, а компьютер работающим и не уходящим в спящий режим!
По результату расчета вам будет предложено скачать архив. Внутри вы найдете pdb файлы 5 предсказаний. rank_1 – лучшее предсказание, rank_5 – худшее. Везде достаточно будет обсудить лучшее предсказание. Ссылку на архив/архивы приложите к практикуму.
A. Amyloids
Сделайте 3 запуска ColabFold.
В первом предскажите структуру мономера. Вставьте вашу последовательность в поле query_sequence. Дайте работе осмысленное название в поле jobname. Больше ничего делать не нужно, из верхнего меню выберите Runtime > Run all.
Во втором запуске предскажите структуру из 5 молекул. Для этого в поле query_sequence вбейте вашу последовательность 5 раз, разделяя знаком ":".
В третьем запуске предскажите структуру из 10 молекул.
Опишите результаты предсказаний. Получилось ли AlphaFold предсказать структурные особенности амилоидов? Найдите в банке PDB структуры для ваших последовательностей. Выглядят ли они похоже на результаты предсказания AF? Насколько, на ваш взгляд, генерализуются полученные вами результаты?
B. Helices
Вам даны seqA, seqB, seqC.
В чем отличия между последовательностями?
Сделайте предсказание для seqA. Вставьте вашу последовательность в поле query_sequence. Дайте работе осмысленное название в поле jobname. Больше ничего делать не нужно, из верхнего меню выберите Runtime > Run all. Изучите результат. Где относительно структуры seqA локализованы отличия от seqB и seqC? Какое влияние этих отличий на структуру вы ожидаете?
Сделайте предсказания для seqB и seqC. Какие структуры предсказал AlphaFold? Соответствуют ли его предсказания вашим ожиданиям? Насколько реалистичны сделанные им структуры? Насколько, на ваш взгляд, генерализуются полученные вами результаты?
C. Proteases
Вам дан UNIPROT ID протеазы и сиквенс ее субстрата из MEROPS (там этот субстрат отмечен как физиологически релевантный). Используйте возможности ColabFold для предсказания комплекса. Вставьте последовательность вашего фермента в поле query_sequence, после чего вбейте разделитель ":" и за ним – последовательность субстрата. Дайте работе осмысленное название в поле jobname. Больше ничего делать не нужно, из верхнего меню выберите Runtime > Run all.
Получилось ли AlphaFold предсказать релевантный комплекс фермент-субстрат? Как должен был бы располагаться субстрат в активном центре этой протеазы? Привлеките данные из литературы. Насколько, на ваш взгляд, генерализуются полученные вами результаты? Можно ли использовать AlphaFold для задачи предсказания комплексов протеаз с субстратами? Какие контроли можно поставить для проверки универсальности ваших умозаключений и выводов?
D. Deletion
Вам дано две последовательности, seqA и seqB. Вторая – это первая с Н-концевой делецией. Предскажите структуры для обеих независимо. Для каждой вставьте последовательность в поле query_sequence. Дайте работе осмысленное название в поле jobname. Больше ничего делать не нужно, из верхнего меню выберите Runtime > Run all. Изучите результат.
Как устроена структура белка без делеции? Правдоподобна ли структура белка с делецией? Есть ли подозрительные участки в этой структуре? Насколько, на ваш взгляд, генерализуются полученные вами результаты? Какие контроли можно поставить для проверки универсальности ваших умозаключений и выводов?
E. Metamorph
Вам дана последовательность метаморфного белка, т.е. белка, способного принимать различные стабильные укладки.
Вариант "сделайте мономер".
Вставьте последовательность в поле query_sequence. Дайте работе осмысленное название в поле jobname. Больше ничего делать не нужно, из верхнего меню выберите Runtime > Run all. Изучите результат. Есть ли различия между 5 моделями?
Сделайте второй запуск ColabFold. В этот раз не стройте выравнивание (т.е. не используйте эволюционную информацию), выбрав msa_mode – single_sequence. В num_recycles выберите 6 или больше. Изучите результат. Есть ли различия между 5 моделями? Есть ли отличия от моделей, полученных классическим "эволюционным" запуском?
Получилось ли таким образом предсказать обе формы этого метаморфа (для них есть PDB, найдите их с помощью protein blast)? Что ваши результаты значат для задачи предсказания структуры произвольного белка? Насколько, на ваш взгляд, генерализуются полученные вами результаты? Какие контроли можно поставить для проверки универсальности ваших умозаключений и выводов?
Вариант "сделайте димер".
Отличается тем, что данную последовательность вам нужно вставить дважды через разделитель ":". Остальные действия те же, что в первом варианте.