Практикум 8. Вторичная структура

Задание 1. Работа с разметкой вторичной структуры в ручном режиме

В этом практикуме я работала со структурой 2AXW из 6 практикума. С помощью 2Struc я получила аннотацию вторичной структуры посредством использования разных алгоритмов. На рис.1 изображено выравнивание аннотации от DSSP, STRIDE, PSEA, STICKS.
1
Рис.1. Выравнивание аннотаций вторичной структуры.
Аббревиатуры в выравнивании: H = спираль, E = бета-лист, O = другие, X = неопр./No Consensus, B = остаток в изолированном бета-мостике, S - изгиб,T = поворот с водородной связью, C - coil, неопр.
Первое, что можно сказать, данный белок - beta-белок так как не имеет альфа спиралей. Рассмотрим позиции 76, 79. 76 позицию DSSP определил как S - изгиб, а Stride - как T. Насколько я смогла разобраться, это вообще-то не то что разные вещи, наверное, было бы логично назвать это поворотом, т.е. turn, потому что здесь происходит именно разворот цепи в другую сторону, который стабилизируется водородной связью 76 остатка с 79 (i, i+3). В данном случае тогда непонятно, почему согласно DSSP 76 остаток относится к изгибу, а 79 нет, он в этом случае вообще неопределен, а в Stride он тоже turn как и 76. PSEA, STICKS в случае этих остатков просто не смогли определиться (рис. 3).
Рассмотрим теперь остатки 88-89. Как-то определить структуру в этих позициях смог только метод DSSP, и определил он их как изгиб (рис. 4). Остаток 88 здесь взаимодействует с группой гистидина на соседней петле, и вообще, как мне кажется, тут цепь не особо изгибается, поэтому я бы не стала очень доверять DSSP в этом случае, а 79 остаток взаимодействует с атомом азота остатка цистеина и тут можно наверно даже говорить, что относится к бета-листу, хотя такой вид структуры тут не обнаруживается ни одним из методов. Возможно, если остов остатка изгибается, но при этом он образует водородные связи как в бета-листе, он все равно уже не может считаться частью бета-листа, по крайней мере алгоритмы, которые учитывают расстояние и углы между альфа атомами углерода, не распознают такое.
2
Рис.2 окрашивание белка согласно вторичной структуры.
3
Рис.3 Участок 75-80 аминокислотных остатков
Еще один пример расхождения между приведенными методами на рис. 5 - участок бета листа в позициях 106-111: здесь DSSP и Stride определили участок как бета-лист, а два других метода - никак не определили, хотя бета-структура тут довольно очевидная. Возможно, все эти различия в работе алгоритмов связаны именно с торсионными углами в остове.
3
Рис.4 Участок, включающий 88-89 аминокислотные остатки
3
Рис.5 Участок, включающий 106-111 аминокислотные остатки и соседняя цепь в бета тяже (зеленая) из другой цепи белка - B

Задание 2. Работа с разметкой вторичной структуры в автоматическом режиме

Мне было выдано 30 pdb файлов. С помощью комманды " for f in /srv/www/htdocs/FBB/year_18/sbinf2021/2021.T8/ olga.shigal/*.pdb; do let "a+=1"; dssp -i ${f} -o ${a}.dssp; done;" я получила 30 dssp файлов.
Далее, для того, чтобы посчтитать склонности каждого типа аминокислоты образовывать тот или иной тип вторичной структуры (amino acid secondary structure propensity) я написала кое-что в python. Этот скрипт использует файл, в котором собрана информация из предыдущих 30 файлов, полученный этим скриптом.
table
Рис.6. Таблица с аминокислотами по типу вторичной структуры
table
Рис.7. Таблица с аминокислотами по типу вторичной структуры с добавленными псевдокаунтами
Из таблицы на рис.6 можно заметить, что в петлях для некоторых остатков (аспартат, лизин, треонин) склонности находиться тут нулевые. Поэтому я добавила псевдоукаунты = 1 (рис.7), чтобы избавиться от нулевых значений n_ik, т.е. количества остатков i в датасете, образующих тип вторичной структуры j. Возможно, можно было подобрать другое значение, но я не очень знаю как его подбирать.
Рассмотрим таблицу на рис. 7. Можно заметить, что заряженные аминоксилоты Q, R и A чаще находятся в спиралях, чем в других классах вторичных структур. Причем, значения для глутамина и аргинина достаточно близки между собой, а аспартат как раз ни разу не встретился в петлях в данном наборе белков. По моим вычислениям валин оказался наиболее вероятен образовывать бета-струткруры, чем остальные структуры, и по сравнению с дргуими остатками, у него там наибольшая склонность находиться. А вот пролин и глицин наиболее склонны быть в петлях, что согласуется с известным фактом, т.к. пролин слишком не гибкий , а глицин наоборот слишком гибкий.