Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2018

Что может Альфафолд2

4 балла

Продукт, решивший проблему сворачивания белка.

Величайшее достижение искусственного интеллекта.

Технология, перевернувшая игру

Многое из сказанного про AlphaFold2 правда. Генерация гипотез в структурной биологии еще никогда не была так доступна. Помимо полных протеомов модельных организмов, выложенных в открытый доступ, структура любого белка оказывается доступной в течение часа безо всяких собственных ресурсов благодаря проекту ColabFold.

В этом практикуме мы предлагаем вам попробовать самим запустить ColabFold. При планировании работы учтите, что один запуск может занять до получаса, и в практикуме может быть нужно сделать до 3 запусков.

Выбор кейса

Занесите ваш логин в таблицу напротив выбранного кейса.

Описание кейсов

Во всех вам предстоит работать в ColabFold. В течение самого расчета от вас ничего не требуется, можно на 20 минут уйти заниматься другими делами. Оставьте вкладку открытой, а компьютер работающим и не уходящим в спящий режим!

По результату расчета вам будет предложено скачать архив. Внутри вы найдете pdb файлы 5 предсказаний. rank_1 – лучшее предсказание, rank_5 – худшее. Везде достаточно будет обсудить лучшее предсказание. Ссылку на архив/архивы приложите к практикуму.

A. Amyloids

Сделайте 3 запуска ColabFold.

В первом предскажите структуру мономера. Вставьте вашу последовательность в поле query_sequence. Дайте работе осмысленное название в поле jobname. Больше ничего делать не нужно, из верхнего меню выберите Runtime > Run all.

Во втором запуске предскажите структуру из 5 молекул. Для этого в поле query_sequence вбейте вашу последовательность 5 раз, разделяя знаком ":".

В третьем запуске предскажите структуру из 10 молекул.

Опишите результаты предсказаний. Получилось ли AlphaFold предсказать структурные особенности амилоидов? Найдите в банке PDB структуры для ваших последовательностей. Выглядят ли они похоже на результаты предсказания AF? Насколько, на ваш взгляд, генерализуются полученные вами результаты?

B. Helices

Вам даны seqA, seqB, seqC.

В чем отличия между последовательностями?

Сделайте предсказание для seqA. Вставьте вашу последовательность в поле query_sequence. Дайте работе осмысленное название в поле jobname. Больше ничего делать не нужно, из верхнего меню выберите Runtime > Run all. Изучите результат. Где относительно структуры seqA локализованы отличия от seqB и seqC? Какое влияние этих отличий на структуру вы ожидаете?

Сделайте предсказания для seqB и seqC. Какие структуры предсказал AlphaFold? Соответствуют ли его предсказания вашим ожиданиям? Насколько реалистичны сделанные им структуры? Насколько, на ваш взгляд, генерализуются полученные вами результаты?

C. Proteases

Вам дан UNIPROT ID протеазы и сиквенс ее субстрата из MEROPS (там этот субстрат отмечен как физиологически релевантный). Используйте возможности ColabFold для предсказания комплекса. Вставьте последовательность вашего фермента в поле query_sequence, после чего вбейте разделитель ":" и за ним – последовательность субстрата. Дайте работе осмысленное название в поле jobname. Больше ничего делать не нужно, из верхнего меню выберите Runtime > Run all.

Получилось ли AlphaFold предсказать релевантный комплекс фермент-субстрат? Как должен был бы располагаться субстрат в активном центре этой протеазы? Привлеките данные из литературы. Насколько, на ваш взгляд, генерализуются полученные вами результаты? Можно ли использовать AlphaFold для задачи предсказания комплексов протеаз с субстратами? Какие контроли можно поставить для проверки универсальности ваших умозаключений и выводов?

D. Deletion

Вам дано две последовательности, seqA и seqB. Вторая – это первая с Н-концевой делецией. Предскажите структуры для обеих независимо. Для каждой вставьте последовательность в поле query_sequence. Дайте работе осмысленное название в поле jobname. Больше ничего делать не нужно, из верхнего меню выберите Runtime > Run all. Изучите результат.

Как устроена структура белка без делеции? Правдоподобна ли структура белка с делецией? Есть ли подозрительные участки в этой структуре? Насколько, на ваш взгляд, генерализуются полученные вами результаты? Какие контроли можно поставить для проверки универсальности ваших умозаключений и выводов?

E. Metamorph

Вам дана последовательность метаморфного белка, т.е. белка, способного принимать различные стабильные укладки.

Вариант "сделайте мономер".

Вставьте последовательность в поле query_sequence. Дайте работе осмысленное название в поле jobname. Больше ничего делать не нужно, из верхнего меню выберите Runtime > Run all. Изучите результат. Есть ли различия между 5 моделями?

Сделайте второй запуск ColabFold. В этот раз не стройте выравнивание (т.е. не используйте эволюционную информацию), выбрав msa_mode – single_sequence. В num_recycles выберите 6 или больше. Изучите результат. Есть ли различия между 5 моделями? Есть ли отличия от моделей, полученных классическим "эволюционным" запуском?

Получилось ли таким образом предсказать обе формы этого метаморфа (для них есть PDB, найдите их с помощью protein blast)? Что ваши результаты значат для задачи предсказания структуры произвольного белка? Насколько, на ваш взгляд, генерализуются полученные вами результаты? Какие контроли можно поставить для проверки универсальности ваших умозаключений и выводов?

Вариант "сделайте димер".

Отличается тем, что данную последовательность вам нужно вставить дважды через разделитель ":". Остальные действия те же, что в первом варианте.

2018/7/task10 (последним исправлял пользователь alexander.zlobin 2021-12-08 20:33:09)