Практикум 3

Задание 1. AlphaFold, амилоиды

Для выполнения этого задания я взяла последовательность A13:

DAEFRHDSGYEVHHQKLVFFAEDVGSNKGAIIGLMVGGVVIA

Это пептид Aβ42, участвующий в образовании амилоидных бляшек при болезни Альцгеймера.

Я запустила предсказания AlphaFold для одной молекулы этого пептида, пяти и десяти молекул. Результаты приведены на рис. 1. Цепи раскрашены в зависимости от confidence AlphaFold'а при помощи скрипта, найденного в открытом доступе.

Сразу бросается в глаза, что β-амилоид... не образует β-листов с соседними пептидами. Справедливости ради, все эти структуры и имеют низкую confidence.

На рис. 2 показано, как выглядит структуры мономера и пентамера этого амилоида, полученные при помощи ЯМР.

Задание 2. DOMAK

Блокнот в colab с кодом для этого задания можн найти по ссылке.

Для работы мне достался белок с PDB ID 1CG2, это бактериальная карбоксипептидаза. Структура цепи A, оменную структуру которого я предсказывала, приведена на рис. 3., а результат работы алгоритма DOMAK — на рис. 4.

Рис. 3. Структура цепи A 1CG2.
Рис. 4. Результат работы алгоритма DOMAK.

Задание 3. Сравнение с CATH и SCOP

Полученная граница доменов находится между остатками 195 и 196. Самый правый и самый левый пик, полагаю, возникают из-за того, что значения extAB небольшие, и случайные увеличения intA и intB приводят к большому росту Split Function.

На рис. 5 ниже изображено полученное разделение на домены, а на рис. 6 — разделение на домены из баз данных и SCOP (координаты доменов в этих БД совпадают). Можно видеть, что один домен (розовый слева и оранжевый справа) практически совпадает у этих двух предсказаний (в CATH и SCOP он заканчивается не на остатке 195, а на остатке 191). При этом в CATH и SCOP есть еще одно разделение на домены между остатками 301 и 302.

Рис. 5. Предсказанные DOMAK домены.
Рис. 6. Домены из CATH и SCOP. Серым отмечены те части белка, которые не входят ни в один домен.

При этом ни одно из этих разделений не совпадает с визуальным разделением. В структуре отчетливо видны два куска. Почему же предсказание доменов таково? Разделение левого на рис. 5 и 6 участка белка пополам имеет смысл: между этими половинами есть сайт связывания цинка, и, видимо, гидрофобная поверхность. Но, казалось бы, домен, отмеченный голубым на рис. 5, надо разделить на два, между его половинами есть гибкая перемычка. Может, конечно, она на самом деле не гибкая... В любом случае, его разделение на две части в CATH и SCOP выглядит очень странно: оно вообще проходит посередине альфа-спирали.