Совмещение структур
Отбор структурных гомологов
С помощью PDBeFold я получила перечень структурных гомологов белка пероксидазы хрена (PDB ID = 1KZM). У этого белка в PDB файле аннотировано NSSE = 18 элементов вторичной структуры. Из списка гомологов я выбрала следующие находки с 0.8 Å ≤ RMSD ≤ 2.5 Å и длиной выравнивания (Nalign) более 50 % от длины белка (Nquery = 308).
Таблица 1. Структурные гомологи | ||||||
Название | PDB ID | RMSD | Q-score | Nalign | NSSE | Nalign/Nquery |
Arabidopsis Thaliana peroxidase A2 | 1QO4:A | 0.82 Å | 0.91 | 303 | 18 | 98.4 % |
Raphanus Sayivus anionic peroxidase | 4A5G:A | 0.93 Å | 0.89 | 302 | 17 | 98.1 % |
Arabidopsis Thaliana peroxidase N | 1QGJ:A | 0.97 Å | 0.85 | 294 | 17 | 95.5 % |
Peanut peroxidase | 1SCH:A | 1.15 Å | 0.82 | 291 | 16 | 94.5 % |
Совмещение структуры HRP с его 4 структурными гомологами
Далее на странице находок я отметила представленныве выше структуры и с помощью кнопки "Submit for Multiple Alignment" получила множественное выравнивание malign.fasta со следующими характеристиками:
- Число выровненных остатков = 286.
- Число выровненных элементов вторичной структуры = 15.
- Общее RMSD = 0.9427 Å.
- Общий Q-score = 0.8248.
Ниже представлено изображение множественного структурного выравнивания.
![](msalign.png)
Далее я получила файлы с совмещенными структурами ma.rasmol и ma.pdb. И с помощью PyMOL визуализировала последний PDB файл и получила следующее изображение совмещения выровненных структур.
![](ma.png)
В целом, по картинке видно, что найденные гомологичные структуры хорошо накладываются друг на друга даже в области петель.
Следом было решено сравнить выравнивание последовательностей по структуре с выравниванием тех же последовательностей, построенным по алгоритму Muscle. Для визуализации использовалась программа Jalview.
Bыравнивание последовательностей по структуре.
![](malign.png)
Bыравнивание последовательностей по алгоритму Muscle.
![](align.png)
В целом, оба выравнивания практически совпадают, за искючением позиций: 137-138, 159-160, 185-188, 254-261, 292-296 (нумерация в соответствии с выравниванием по структуре). Для позиций 137-138 я бы сделала выбор в пользу структурного выравнивания. Оно кажется более достоверным здесь, хотя само различие незначительно - позиция одного остатка в одной цепи. Аналогично, в случае позиций 159-160. Напротив, для позиций 185-188 более правильным кажется вариант, представленный в выравнивании по последовательностям, так как в этом случае будет больше число консервативных колонок, а также будет учитано, что Phe и Tyr структурно схожие остатки и замена одного на другой по позиции 186 весьма вероятна, как и вероятна эволюционная замена Leu на Ile (позиция 185). Для оставшихся двух областей я так и не определилась, какой вариант считать более достоверным. Думаю, для более однозначных выводов необходимо аналогичным образом построить выравнивания большего числа близкородственных белков.