Задание 1. Знакомство с укладками

Дано 10 записей PDB. Соответствующие этим структурам последовательности демонстрируют не более 40% попарного сходства. Выберем первую из этих структур (2o4cA02) как опорную и выравним все остальные по ней (super pdb2, pdb1). Результат выравнивания можно увидеть на рис.1.

Рис. 1. Выравнивание 10 данных структур (наложение 9 структур на 1 "референсную").

Глядя на полученную картину, нельзя сказать, что белки имеют одинаковую третичную структуру. Но если рассматривать структуры по отдельности или попарно, то окажется, что укладка у них очень похожа: везде есть β-α-β мотив, то есть все эти белки состоят из чередующихся β-тяжей и α-спиралей, однако их количество и положение в пространстве относительно друг друга может быть различным. В качестве иллюстративного примера приведу одно из выравниваний на рис. 2: как можно видеть, выравнивание не очень хорошее, хотя паттерн вторичных структур прослеживается один и тот же. Белок, изображённый зелёным на рис. 2, начинается с крайней α-спирали, в то время как белок, изображённый жёлтым, - с центрального β-тяжа. В выравнивании третичных структур β-листы и α-спирали оказываются сдвинутыми относительно друг друга. Думаю, что данная группа белков - какое-то подмножество некоторой топологической группы в CATH.

Рис. 2. Выравнивание 2o4cA02 ("референс") и 3o9zA01.

Задание 2. Работа с разметкой вторичной структуры в ручном режиме

Pymol делает разметку вторичной структуры по умолчанию, используя алгоритм dssp. Воспользуемся примером из предыдущего задания и рассмотрим аналогичные участки белков, где Pymol немного по-разному размечает вторичную структру (рис. 3). В одной из структур Pymol отмечает небольшую α-спираль, в другой структуре на этом месте просто петля. "Альфа-спираль" начинается с двух пролинов, что порождает некоторые сомнения. Однако внутри предполагаемой вторичной структуры я обнаружила три водородные связи между атомами остова: все они образованы с шагом 4 остатка и в каждом образованном цикле 13 атомов, что свидетельствует в пользу того, что перед нами действительно альфа-спираль. В то же время, на аналогичном участке другой структуры водородных связей между атомами остова не найдено и спирали там действительно нет.

Рис. 3. Спорное место с точки зрения вторичной структуры: в одном из белков здесь отмечена альфа-спираль, в другом - петля.
Рис. 4. Детальное рассмотрение структуры в двух случаях: DSSP размечает альфа-спираль (верх.) и не размечает никакой вторичной структуры (ниж.)

Задание 3. Работа с разметкой вторичной структуры в автоматическом режиме

Для каждого из 10 pdb сгенерируем разметку вторичной структуры с помощью dssp. Используя python, расчитаем склонности каждого типа аминокислоты образовывать тот или иной тип вторичной структуры (amino acid secondary structure propensity): P_ik = (n_ik/n_i) / (N_k/N), где P_ik - это propensity аминокислотного остатка i образовывать тип вторичной структуры k, n_ik - это количество остатков i в датасете, образующих тип вторичной структуры k, n_i - это общее количество остатков i в датасете, N_k - это общее количество остатков, образующих тип вторичной структуры k во всем датасете, N - это общее количество остатков в датасете. Отметим, что в этом задании для простоты мы рассматриваем только три типа вторичных структур: альфа-спираль ('H'), бета-лист ('E') и петля ('C') (петля = всё, что не является бета-листом или альфа-спиралью). Кроме того, необходимо добавить в формулу для расчёта псевдокаунты (или "псевдоотсчёты"): ведь если в нашем небольшом датасете из 10 структур какой-то тип остатка никогда не встретится в одном из типов вторичных структур, это не значит, что он там вообще никогда не встречается. Псевдокаунты можно выбирать по-разному, в данном случае я просто прибавила 1 к каждому числу в формуле, искусственно добавив таким образом 1 остаток данного типа в данную вторичную структуру. Таблицу, которая получилась в результате, можно увидеть здесь:

Ссылка на таблицу с результатами

Выяснилось, что в бета-листах больше всего любит появляться валин (встречается примерно в 2.5 раза чаще, чем ожидается), в альфа-спиралях - метионин (propensity = 1.78), а на втором месте после него с небольшим отрывом - глутамин (1.71), в петлях - глицин (propensity = 1.5). Бета-листы вообще предпочитают алифатические и ароматические остатки: кроме валина, лейцин и изолейцин, фенилаланин и триптофан. Бета-листы, видимо, удобны для образования гидрофобных ядер, радикалы остатков могут торчать внутрь белка и не взаимодействовать ни с чем полярным. Альфа-спирали, в среднем, более гидрофильны. Мне не вполне понятно, почему метионин отдаёт предпочтение им и совсем не вcтречается в бета-листах (в датасете не встретился ни разу). Поскольку в данном случае мы рассматриваем не случайное множество белков, а белки, по-видимому, относящиеся к одному структурному семейству (см. 1 задание), функционально они тоже могут быть схожи. Могу предположить, что метионин может входить в активный центр данной группы белков и, например, участвовать в связывании лигандов, и данную функцию, скорее всего, удобнее осуществлять, находясь в альфа-спирали или петле, а не в жёстком гидрофобном бета-листе. Что касается предпочтения глицином петель, то это легко объяснимо: глицин может принимать множество различных конформаций, и, следовательно, мы ожидаем его увидеть в более гибких, неструктурированных участках белка.


© Быкова Даша, 2020