Вторичная структура

Задание 1. Работа с разметкой вторичной структуры в ручном режиме

Для структуры 7b94, которую я ранее анализировала а практикуме 2, была сгенерирована аннотация вторичной структуры с помощью 2Struc . Я сравнивала разметку, предложенную алгоритмами DSSP и STRIDE. В числе различий STRIDE и DSSP разные способы определения водородных связей, а также проверка углов в случае алгоритма STRIDE.

Хочу заметить, что аннотация похожа у двух программ. Различия в основном наблюдались при классификации остатков, принадлежащих концам альфа-спиралей и бета-структур. Также расхождения периодически наблюдались в разметке поворотов, бета-мостиков и изгибов (bend). Рассмотрим некоторые ситуации подробнее.

  • GLU-144 не отмечен как остаток бета-тяжа в DSSP, однако считается его продолжением по мнению STRIDE (Рисунок 1). В алгоритме DSSP мостик между i и j остатком в антипараллельном листе считается по формуле Bridge(i,j) =: [Hbond(i,j) and HBond(j,i)] или [Hbond(i-1, j+1) and HBond(j-1, i+1)]. Получается, что GLU-144 по DSSP мостиком не будет, так как его кислород остова развернут и остаток не образует требуемого паттерна из двух водородных связей. В рассматриваемом случае образуется одна остовная водородная связь между азотом GLU-144 и кислородом GLY-128. Кроме того, здесь встречается структура, называемая бета-выступ - нарушение, которое нередко встречается в антипараллельных бета-структурах. [1]

    В данном случае я согласна с DSSP и считаю, что последним остатком должен считаться остаток под номером 143. GLY-144 скорее уже не считается частью бета-структуры, я не увидела в нем требуемого паттерна для водородных связей в бета-структуре. GLY-128, с которым у него обнаруживается водородная связь, обоими алгоритмами отнесен к Other/Coli, что верно.

  • align
    example
    Рисунок 1. Приведен участок из выдачи Struc2, а также вручную измеренные параметры для GLU-144 (розовый).
    RP
    Рисунок 2. Карта Рамачандрана.
  • Позиции 149 и 150 были определены STRIDE как бета-структуры. Наблюдаемый участок действительно похож на связанные бета-тяжи (Рисунок 2). Остаток SER-150 по углам попадает в разрешенную область, определенную для бета-структур, что нельзя сказать про GLY-149, и в целом глицин дестабилизирует бета-структуры. Атом азота GLY-149 не будет образовывать водородную связь с кислородом остова VAL-198. Здесь я склоняюсь к версии STRIDE, по которой остаток 150 является бета-мостиком (единичный фрагмент, а котором обнаруживаются паттерны бета-структуры), а GLY-149 не относится к определенному типу вторичной структуры. Определение STRIDE могло оказаться правильным из-за учета углов.

  • example
    Рисунок 2. Приведен участок из выдачи Struc2, а также вручную измеренные параметры для GLY-149 и SER-150.
  • В третьем примере были по-разному размечены концы альфа спирали. На Рисунке 3 можно увидеть, что начиная с THR-55 (i), расстояние между C-O [i] и N-H [i+4] LYS-59 велико, и водородной связи не будет в этом случае. Здесь возможна связь между 55 и 58 остатками, 56 и 59, 57 и 60 остатками (i и i + 3). Я склоняюсь к тому, что LYS-57 - последний остаток в спирали, так как он еще участвует во взаимодействии с остатком под номером 53 [i-4]. Остатки 58 и 59 по результатам моих изменений попадали в области, характерные для 3,10-спиралей. В данном случае я скорее согласна со DSSP, что GLN-58 и LYS-59 - это повороты.

  • align example
    Рисунок 3. Приведен участок из выдачи Struc2, а также вручную измеренные параметры для GLN-58 и прилежащих остатков.

    Задание 2. Работа с разметкой вторичной структуры в автоматическом режиме

    Я рассмотрела набор из 30 белков и для каждого сгенерировала разметку вторичной структуры с помощью DSSP. Данные из разных белков были объединены в один набор, и для каждого типа аминокислоты была посчитана метрика popensity, которая отражает склонность к образованию определенной вторичной структуры. Для подсчета использовалась следующая формула:

    P_ik = (n_ik/n_i) / (N_k/N), 

    P_ik - это propensity аминокислотного остатка i образовывать тип вторичной структуры,
    n_ik - это количество остатков i в датасете, образующих тип вторичной структуры j
    n_i - это общее количество остатков i в датасете
    N_k - это общее количество остатков, образующих тип вторичной структуры j во всем датасете
    N - это общее количество остатков в датасете

    Использовалсь упрощенная классификация, по которой считалось, что остаток может принадлежать к трем классам вторичной структуры: "E" (бета тяж), "H" (альфа-спираль), "C" (другое). Таблицу можно загрузить по ссылке: Таблица (.tsv)

  • Пролин заметно чаще встречается в петлях, чем в регулярных вторичных структурах. Если и встречается, то обычно на концах данных мотивов. У пролина диапазон угла phi сильно ограничен, а также он не может выступать донором водородной связи, поэтому он реже обнаруживается в альфа-спирали или бета-структуре.[2]
  • В моей модели фенилаланин чаще встречается в бета-тяжах, чем в спиралях и петлях. Бета-слои обычно удерживаются гидрофобными взаимодействиями, поэтому благоприятно наличие остатков с большими неполярными боковыми группами. [3]
  • Остатки глутаминовой кислоты склонны образовывать альфа-спирали, чем иные структры. Это предпочтение не объясняется химической природой остатка. Например, близкая к нему по свойствам аспарагиновая кислота, напротив, чаще встречается в бета-поворотах. [4]
  • [1] The beta bulge: a common small unit of nonrepetitive protein structure

    [2] Proline: The Distribution, Frequency, Positioning, and Common Functional Roles of Proline and Polyproline Sequences in the Human Proteome

    [3]The Supramolecular Chemistry of β-Sheets

    [4]The alphabet of intrinsic disorder

    Вернуться на главную