Совмещение структур

Поиск структурных гомологов

Для поиска структурных гомологов рассматриваемого ABC-транспортерного периплазматического связывающего аминокислоты белка (PDB ID 2YJP) использовался сервис PDBeFold. Рассматривалась только субъединица, обозначенная в PDB как цепь А. Всего было найдено 89 совпадений, далее будем рассматривать 3 структурных гомолога с лучим Q-score, а именно структуры 4zef, 2ia4, 5h8q.


Рис.1. Выдача PDBeFold.

Совмещение 2yjp с гомологами

Для четырех структур (2yjp, 4zef, 2ia4, 5h8q) было получено структурное выравнивание (переведенное из формата скрипта Rasmol в сессию PyMol для удобства работы). Полученное совмещение продемонмтрировано на рис.2. Выравнивание последовательностей по совмещению структур, полученное из PDBeFold, показано на рис.3.


Рис.2. Пространственное совмещение структур 2yjp, 4zef, 2ia4, 5h8q, полученное с помощью PDBeFold. 2yjp - зеленый, 4zef - голубой, 2ia4 - розовый, 5h8q - желтый. A - белки показаны в виде cartoon. B - белки показаны в виде цепочек С-α атомов.

Рис.3. Выравнивание последовательностей по структурному совмещению помощью PDBeFold. Полное выравнивание в формате fasta доступно по ссылке.

Также были скачены последовательности выбранных белков и по ним было построено их выравнивание с помощью программы mafft. полученное выравнивание можно видеть на рис.4.


Рис.4. Выравнивание последовательностей с помощью mafft. Полное выравнивание в формате fasta доступно по ссылке.

Следует отметить, что полученные выравнивания значительно отличаются. Рассмотрим небольшой участок выравниваний, на котором заметно различие (позиции в выравнивании, содержащая позиции 75-84 из 2yjp, см. рис. 5). Выравнивание по последовательностям mafft расположило в одной колонке Val75 2yjp, Val286 4zef, Gln44 2ia4 и Ile69 5h8q. Далее в выравнивании следует участок, предполагающий наличие вставок в последовательности 2yjp и 2ia4. Следующая выровненная колонка содержит Asp84 2yjp, Asp287 4zef, Glu52 2ia4, Asp70 5h8q. В это же время в структурно-опосредованном выравнивании выравниваются Val75 2yjp, Val286 4zef, Gln44 2ia4 и Ile69 5h8q (как и в mafft), а в следующей колонке расположены Glu76 2yjp, Asp287 4zef, Asp45 2ia4 и Asp70 5h8q. Видимо, mafft пытался максимизировать длину блоков выравнивания. Однако, позиции в 2yjp и 2ia4, которые в выравнивании mafft соотвествуют длинной вставке, на самом деле лежат в одной α-спирали с предыдущей позицией и хорошо пространственно совмещаются с гомологами. Таким образом, структурное выравнивание точнее демонстрирует соответствие позиций в структурных гомологах в данном примере.


Рис.5. Участок выравниваний с помощью mafft и PDBeFold, содержащий отличия. А - mafft, B - PDBeFold. Рассматриваем позиции 82-90 в выравнивании mafft и позиции 81-82 PDBeFold.

Рис.6. А - позиция 82 mafft/81 PDBeFold. B - позиция 82 выравнивания PDBeFold, данные аминокислоты лежат в одной α-спирали, хорошо пространственно совмещаются. С - позиция 90 выравнивания mafft, данные аминокислоты раскиданы на структуре на большие расстояния. 2yjp - зеленый, 4zef - голубой, 2ia4 - розовый, 5h8q - желтый.

Построение совмещения по заданному выравниванию

Для этого задания предлагается выровнять структуры константных доменов Т-клеточного рецептора из цепочек α и β. В качестве α-домена был взят домен из структуры 1QSE. Константному α-домену в рамках этой структуры соответствует участок с 118 по 206 остатки цепи D. В качестве β-домена был взят участок с 119 по 247 остатки цепи E структуры 2ESV.

Далее для этих участков с помощью сервера SheeP были построены карты β-слоев. Их изображения показаны на рис.7 и 8.


Рис.7. Карта β-слоев для α-домена 1QSE

Рис.8. Карта β-слоев для β-домена 2ESV

В α-домене 1qse консервативным цистеином является Cys 139, в β-домене 2esv Cys 148. В качестве множеств атомов для дальнейшего выравнивания были взяты C-α атомы соседей цистеинов, а именно остатков 126-128, 138-140, 179-181 в 1QSE и 129-131, 147-149, 194-196 в 2ESV. С помощью PyMol были построены эти множества и проведено выравнивание структур по ним. Используемые команды приведены ниже.

select 1qse_alpha, 1qse and chain D and resi 118-206
select alpha, 1qse_alpha and resi 126-128+138-140+179-181 and name CA
select 2esv_beta, 2esv and chain E and resi 119-247
select beta, 2esv_beta and resi 129-131+147-149+194-196 and name CA
pair_fit alpha, beta

Полученное совмещение показано на рис.9 и доступно в виде pse-сессии по ссылке. Также на рис.10 приведено пространственное совмещение командой align в PyMol. Как видно из сравнения этих рисунков, совмещение от align не учитывает местоположение цистеинов, но тем не менее общее совмещение не вышлядит бессмысленным и довольно близко к совмещению, построенному по выравниванию.


Рис.9. Совмещение, построенное по выравниванию. 1qse зеленый, 2esv голубой. Цистеины выделены палочками.

Рис.10. Совмещение, построенное методом align в PyMol. 1qse зеленый, 2esv голубой. Цистеины выделены палочками.

Следует отметить, что топологии совмещенных доменов различны. Если покрасить оба домена по ходу цепи (рис.11), то становится заметно несовпадение порядка элементов вторичной структуры, имеющихся в данных доменах. Там, где в одном домене наблюдается петля, соединяющая два β-листа, в другом есть участок α-спирали и тд. Тем не менее, если не учитывать вторичную структуру и только следить за ходом цепи в пространстве, то он совпадает в двух рассматриваемых доменах.


Рис.11. Совмещение, построенное по выравниванию. Домены покрашены в радугу по ходу цепи.

Пара белков, для которых гибкое структурное выравнивание включает существенно больше остатков, чем жесткое

Для выполнения данного задания структура 2yjp была подана на вход сервису fatcat (flexible structure alignment) и PDBeFold (rigid structure alignment). В выдаче обоих сервисов был выбран белок, соответсвующий данным критериям. Так, структура 3del (аргинин-связывающий белок) гибко выравнивается по 228 позициям, и жестко выравнивается по 136.

© Маслова Валентина, 2014
Последнее изменение: 24.09.2014