Анализ трехмерных структур


Определение вторичной структуры

Программы DSSP и Stride

Для определения вторичной структуры белка 1G6C были использованы программы DSSP и Stride. Границы спиралей и тяжей в выдаче программ (DSSP, Stride) оказалась близки к таковым, указанным в pdb-файле модели структуры 1G6C (рис. 1.1).

Рисунок 1.1. Mодель структуры 1G6C (показана только цепь А); α-спирали обозначены розовым цветом, β-листы – голубым цветом

Программа DSSP определила границы α-спиралей в структуре следующим образом (для цепи A; для цепи B результаты аналогичны): 19-25, 41-51 (приведены номера аминокислотных остатков, обозначающих границы элемента). Результаты программы Stride отличаются лишь в границе одной спирали: 19-26, 41-51. Полученные границы можно сравнить с границами аннотации вторичной структуры в pdb-файле: 18-26, 40-52. Аналогичное сравнение можно проделать для определённых β-тяжей. Соответствующие границы приведены в таблице 1. Видно, что границы β-тяжей, определённые программами, в точности соответствуют таковым в pdb-файле, а предсказание границ α-спиралей меньше соответствует pdb-файлу. При этом алгоритмы DSSP и Stride показали сравнимое качество предсказания, а отличие каждой границы неверного предсказания от границы в pdb-файле составляет один аминокислотный остаток.

Таблица 1. Сравнение результатов определения элементов вторичной структуры программами DSSP и Stride для цепи A модели структуры 1G6C

№ элемента
вторичной структуры
Результат DSSP
(номера остатков)
Результат Stride
(номера остатков)
Аннотация в pdb-файле
(номера остатков)
α-спираль
1 19-25 19-26 18-26
2 41-51 41-51 40-52
β-лист
1 28-32 28-32 28-32
2 55-58 55-58 55-58

Сервис SheeP

С помощью SheeP была построена карта β-листа в цепи A структуры 1G6C (были использованы параметры по умолчанию) (рис. 1.2). По карте видно, что выбранный β-лист состоит из восьми тяжей. Изображение его в структуре приведено на рисунке 1.3. Один столбец карты соответствует одному «хребту» (crest) β-листа. Один из таких «хребтов», соответствующий аминокислотам в первом (продолжение в девятом) столбце карты (остаткам Ser27, Gly204, Val184, Gly149, Ala130, Gly109), показан на рисунке 1.4. Посмотрев на расположение активного центра, можно сделать вывод, что "желтой" стороной β-лист обращен к гидрофобному ядру.

Рисунок 1.2. Карта β-листа для структуры 1G6C


Рисунок 1.3. β-лист (выделен желтым цветом)
в структуре 1G6C
Рисунок 1.4. β-лист (выделен желтым цветом) в структуре 1G6C и Cα-атомы,
соответствующие одному из его «хребтов» (показаны в шаровой модели)

Для участка β-листа (3 тяжа, 4-5 гребней) (рис. 1.5) на основании данных программы stride была получена схема водородных связей (рис. 1.6).



Рисунок 1.5. Выбранный участок β-листа.



Рисунок 1.6. Выделенные водородные связи в структуре β-листа.

Совмещение структур

С помощью сервиса PDBeFold были выбраны 4 структурных гомолога 1G6C: 3O16, 1XI3, 3O63, 1YAD. Для гомологов 1G6C и самого белка были загружены выравнивание последовательностей по совмещению структур (попарное и множественное) и само совмещение структур (рис. 2.1).

Рисунок 2.1. Cовмещение структур гомологов 1G6C в JMol, предоставленное сервисом PDBeFold.

Выравнивание по структуре (большие буквы в файле с выравниванием) можно сравнить с выравниванием последовательностей, выполненным, например, в программе JalView (с помощью Tcoffee со стандартными параметрами) (рис. 2.2-2.3).

Рисунок 2.2. Выравнивание последовательностей гомологов 1G6C в JalView; окраска по проценту идентичности.

Рисунок 2.3. Выравнивание по структуре гомологов 1G6C в JalView; окраска по проценту идентичности.

При сравнении множественного выравнивания последовательностей с выравниванием последовательностей по структуре удаётся выявить несколько различий. Например, в выравнивании по последовательности Glu94 выравнивается с Gly94, в то время как в в выравнивании по структуре вместо Gly94 мы видим Asp94. Можно отметить, что все найденные несоответствия наблюдаются именно в неструктурированных участках (рис. 2.4).


Рисунок 2.4. Фрагменты выравниваний, где наблюдаются различия. Верхняя картинка - выравнивание по структуре; нижняя - по последовательности.

Поиск структурных гомологов для домена 1adj C:326-419

С помощью сервиса PDBeFold был осуществлен поиск стрктурных гомологов для домена 1adj C:326-419, однако искомый домен найден не был. На рисунке 2.5 показана выдача с сайта. Результаты отсортированы по RMSD.

Рисунок 2.5. Результат поиска структурных гомологов для домена 1adj C:326-419 в PDBeFold.

Совмещение по заданному выравниванию

Для совмещения по заданному выравниванию были выбраны структуры константного домена человеческого Т-клеточного рецептора из цепи α (1oga,region d: 118-202) и из цепи β (1oga, region e: 119 - 245) (рис. 2.6).


Рисунок 2.6. Домены человеческого Т-клеточного рецептора из цепи α и из цепи β.

С помощью сервиса SheeP были получены карты β-листов доменов (рис. 2.7-2.9). Карты приведенных ниже листов находятся в одной ориентации.


Рисунок 2.7. Карта бета-листа для домена из цепи α (map0).


Рисунок 2.8. Карта бета-листа для домена из цепи β (map0).


Рисунок 2.9. Карта бета-листа для домена из цепи β (map1).

Консервативные остатки цистеина задают выравнивание центрального тяжа. Остатки, спаренные с консервативным цистеином, задают выравнивание соседних тяжей. Таким образом было построено выравнивание. Используя информацию о выровненных остатках, в программе PyMol было построено совмещение этих доменов (рис. 2.9), в частности с помощью следующих команд:

select a, alpha and name CA and resi (122+133-135+155+175)
select b, beta and name CA and resi (127+144-146+172+192)
pair_fit a, b

Также было получено изображение участков совмещенных структур (рис. 2.10). Из рисунка видно, что ход полипептидной цепи совпадает.


Рисунок 2.10. Совмещение доменов T-клеточного рецептора. Цепь α - фиолетовым; β - серым.

Нахождение гидрофобных кластеров

С помощью сервиса Clud в структуре 1G6C был произведён поиск гидрофобных кластеров. Со значениями 5.4 и 3 для порога расстояния и размера кластера, соответственно, было найдено 6 кластеров, которые обозначены на рисунке 3.1.

Рисунок 3.1. Гидрофобные кластеры в структуре 1G6C

Пожалуй, можно сказать, что найденные кластеры отвечают группам (с одним и более) элементов вторичной структуры белка, определяемым визуально.

Поиск гидрофобных кластеров в димере белка 3Q8T (цепях A и B структуры с мотивом coiled coil) позволяет различить гидрофобные кластеры в участках контакта двух спиралей (значения для порога расстояния и размера кластера – 4.5 и 3, соответственно) (рис. 3.2).

Рисунок 3.2. Гидрофобные кластеры в участках контакта спиралей в структуре 3Q8T

Построение поверхности, раскраска участка поверхности: pymol

Для комплекса димера пуринового репрессора с ДНК (биологическая единица 1JFT) с использованием средств программы PyMol были созданы изображения, демонстрирующие контакт мономеров белка и между собой и контакт белка с ДНК. Контакты поверхности мономера белка с симметричным мономером и с двойной спиралью ДНК представлены на рисунках 4.1-4.3.



Рисунок 4.1. Изображение поверхности контакта мономера белка с симметричным мономером (область контакта выделена красным цветом) на фоне остовной (ribbon) модели мономеров. Мономеры показаны разными цветами.



Рисунок 4.2. Изображения поверхности контакта (область контакта выделена красным цветом) димера белков с двойной спиралью ДНК на фоне остовной (ribbon) модели белка. Изображения получены с разных ракурсов.



Рисунок 4.3. Изображение поверхности контакта ДНК (область контакта выделена красным цветом, и атомы представлены в виде сфер) с димером белка на фоне проволочной (sticks) модели двойной спирали.

С помощью сервиса Clud в структуре 1JFT были определены гидрофобные кластеры объёмом не менее 10 атомов на интерфейсе мономеров белка (distance threshold – 5 Å) (рис. 4.4).



Рисунок 4.4. Изображения гидрофобных кластеров на поверхности контакта мономера белка с симметричным мономером в виде cartoons и ribbons (кластеры, полученные с помощью сервиса Clud, показаны синим, оранжевым и пастельно-розовым цветами).

Сравнение доменов SCOP/SCOPe, ECOD, CATH и Pfam

Для структуры 1CTT был произведен поиск доменов в Pfam, SCOPe, ECOD, CATH. Структура 1CTT (TRANSITION-STATE SELECTIVITY FOR A SINGLE OH GROUP DURING CATALYSIS BY CYTIDINE DEAMINASE) соcтоит из субъединицы A. Указанные ниже домены, найденные для цепи A, довольно хорошо коррелируют друг с другом. Подробная информация о координатах доменов представлена в таблице 2.

Таблица 2. Координаты доменов SCOPe, ECOD, CATH и Pfam для цепи A модели структуры 1CTT

Сервис Координаты домена 1 Координаты домена 2
Pfam 48-142
dCMP_cyt_deam_1
157-277
dCMP_cyt_deam_2
SCOPe 1-150
d1ctta1
151-294
d1e0ta3
CATH 29-179
1cttA01
180-294
1cttA02
ECOD 1-150
e1cttA1
151-294
e1cttA2


Рисунок 5.1. Разметка структуры на домены Pfam, SCOPe, CATH и ECOD. Домены окрашены в светло и темно - розовый цвет.

Исходя из полученных координат доменов и рисунка 5.1, можно сделать вывод, что домены в Pfam и SCOPe совпадают не полностью, а SCOPe идеально совпадает с ECOD. Известно, что сервис Pfam осуществляет поиск функциональных доменов, а SCOP - структурных. Домены Pfam примерно соответствуют доменам SCOP, но они короче и лежат внутри таковых в SCOPe. Домены CATH - является чем-то "средним" между SCOPe и Pfam.

Использование сайта PDB

Скачайте все последовательности белков, структуры которых определенны при помощи метода электронной микроскопии, в виде одного FASTA файла. Используйте Advanced search.

В результате поиска с использованием параметра Experimental Method: ELECTRON MICROSCOPY было найдено 917 структур. Скачанные последовательности белков представлены в FASTA файле.

Сравните список структурных гомологов, определенных для вашего белка программой PDBeFold с таким же списком из программы jFATCAT. Последний список есть прямо на странице PDB.

При поиске структурных гомологов программой jFATCAT в PDB для структуры 1G6C, к сожалению, ни одного гомолога не было обнаружено. Поэтому была взята сходная структура того же белка - 2TPS. В PDBeFold было найдено 2258 записей, в то время как в jFATCAT с порогом на Р-value < 0.001 - 444. Всего лишь 62 записи из PDBeFold найдены в jFATCAT.

Список из PDBeFold: reslist.dat
Список из jFATCAT в PDB: jFATCAT.xlsx


© Novikova Maria, 2015
Последнее обновление: 13.12.2015