Структурное выравнивание

Поиск структурных гомологов и совмещение структур

Для лактатдегидрогеназы (ЛДГ) Cyptosporidium parvum (PDB id: 4nd1, 4nd1.ccp4) в PDBeFold найдено 4 гомолога, удовлетворяющих условиям RMSD=[0.8, 2.5] Å и длина выровненного участка - не менее 50% от общей.
pdb-id:цепь (и pdb-файл по ссыке)белокорганизмразрешение, ÅRMSDДлина выравнивания, %
2hjr:A Малатдегидрогеназа(МДГ) в комплексе с лимонной кислотой и аденозин-5-дифосфорибозой (ARP) Cryptosporidium parvum2,20,9195
3czm:A ЛДГ в комплексе с NAD и OXQToxoplasma gondii2,30,9389
3gvh:B МДГ в комплексе с NAD Brucella melitensis2,31,0695

Выравнивание последовательностей, полученное при структурном выравнивании (в результатах выдачи PDBeFOLD по кнопке "download FASTA alignment"): al1.seq. Структурное выравнивание доступно в формате Rasmol send.rasmol и визуализировано в PyMol:
  • Модифицированный для PyMol файл со структурами (убраны команды Rasmol в начале файла): al1.pdb .
  • Скрипт для покраски в PyMol (переписан с команд Rasmol, убранных из send.rasmol): pymol_for_al1.txt, запуск из PyMol: @pymol_for_al1.txt).

Цветами выделены участники выравнивания: palegreen - 4nd1:A, limegreen - 2hjr:A, splitpea - 3czm:B, forest - 3gvh:B

Рис. 1: Выровненный участок, видно расхождение хвостов цепей


Рис. 2: Выровненные лиганды: NAD совместились, а ARP (рыжая) совмещается только соответствующим NAD'у хвостом

В качестве примера несовпадения можно привести следующий участок:

Рис. 3: Пример 2 несовместившихся участка петли (серые на фоне окрашенных)


Рис. 4: Участок 1, не совместились ASP


Рис. 5: Участок 2, не совместились GLY


Рис. 5: Те же участки в выравнивании последовательностей, полученном при структурном выравнивании (красная рамка)


Рис. 6: Место выравнивания (слева), и вариант "исправления" без учёта совмещения структур

Выравнивание последовательностей с помощью MAFFT как раз и выдаёт представленный на рис. 6 вариант справа:

Рис. 7: Выравнивание последовательностей в MAFFT, в красной рамке - участок несовместившихся в структурном выравнивании остатков

Совмещение по заданному выравниванию

Длля совмещения выбраны следующие константные домены субъединиц TCR (T-Cell receptor):
α-субъединица: PDB id = 2F54, константный домен на цепи K, остатки 115-205 β-субъединица : PDB id=2NTS, константный домен на цепи P, остатки 119-245

Домены извлечены в отдельные структурные файлы с помощью PyMol (select->extract->export molecule) (номера остатков, меж которыми содержится константный домен, взяты из SCOP)
С помощью сервиса SheeP построены карты β-слоёв константных доменов:

Рис. 8: Карты β-слоёв, консервативные цистеины - в зелёной рамке

В единственном β-слое α-субъединицы и в первом β-слое β-субъединицы есть консервативный цистеин (Рис. 8, в зелёной рамке), по которому можно выполнить совмещение этих β-слоёв. Использованные для совмещения команды:
select a_su, 2f54_a_C1 and name ca and resi 123-125+135-137+176-178
select b_su, 2nts_b_C1 and name ca and resi 129-131+147-149+194-196
pair_fit a_su, b_su

Файл с совмещением: al2.pdb

Рис. 9: Результат совмещения β-слоёв по цистеинам и окружающим их остаткам, α-субъединица и β-субъединица

По выбранным остаткам совмещение прошло удачно с RMS = 0.533. Однако нижние тяжи β-слоёв сильно разошлись, и вряд ли сойдутся, если выбрать остатки для совмещения как-то иначе. Топология β-слоёв оказалась схожей (нумерация тяжей - сверху вниз по по Рис.9): хвост -> тяж 1, слева направо -> петля -> тяж 2, справа налево -> петля (в другой β-слой у β и просто петля у α-субъединицы) -> тяж 4, справа налево -> петля -> тяж 3, слева направо).