Анализ трехмерных структур

Определение вторичной структуры

Для выполнения задания была взята структура 4FXJ. 4FXJ - структура M2 пируват киназы в комплексе с фенилаланином. На рисунке 1.1 представлена цепь A белкового комплекса. Разметка данной структуры была взята, исходя из аннотации в .pdb-файле.



Рисунок 1.1. Разметка вторичной структуры 4FXJ в .pdb-файле. Золотым цветом обозначены α-спирали, красным - β-тяжи.


Для предсказания вторичной структуры использовалась программа DSSP. Границы спиралей и тяжей в выдаче программы DSSP оказалась близки к таковым, указанным в pdb-файле модели структуры 4FXJ. Интересно, что Stride) выдал пустой результат. Результаты работы программы DSSP и сравнение их с разметкой в .pdb-файле приведены в таблице 1.

Таблица 1. Результаты определения границ элементов вторичной структуры программой DSSP для цепи A структуры 4FXJ.
Аннотация PDB Разметка DSSP
α-спираль
157-6858-67
280-9681-95
3145-149отсутствует
3163-168164-167
4222-235223-234
β-тяж
146-5046-50
271-7571-75
3109-113109-113

Как видно из таблицы 1, программа DSSP в сравнении с разметкой в .pdb-файле предсказывает α-спирали менее точно, чем β-тяжи.

С помощью SheeP была построена карта β-листа в цепи A структуры 4FXJ (были использованы параметры по умолчанию) (рис. 1.2). По карте видно, что выбранный β-лист состоит из восьми тяжей. Изображение его в структуре приведено на рисунке 1.3. Один столбец карты соответствует одному «хребту» (crest) β-листа. Один из таких «хребтов», соответствующий аминокислотам в одном столбце карты, показан на рисунке 1.4. По распределению гидрофильных и гидрофобных остатков на карте оказалось трудно сразу определить, какие остатки листа обращены внутрь гидрофобного ядра, а какие - наружу. Посмотрев на расположение активного центра, можно сделать вывод, что "желтой" стороной β-лист обращен к гидрофобному ядру.



Рисунок 1.2. Карта β-листа для структуры 4FXJ. Красным цветом отмечен выбранный β-лист. Зеленым цветом отмечен выбранный участок β-листа для анализа водородных связей.



Рисунок 1.3. β-лист (выделен желтым цветом) в структуре 4FXJ.



Рисунок 1.4. β-лист (выделен желтым цветом) в структуре 4FXJ и Cα-атомы, соответствующие одному из его «хребтов» (показаны в шаровой модели).

Для участка β-листа (3 тяжа, 4-5 гребней) (рис. 1.2) на основании данных программы stride была получена схема водородных связей (рис. 1.5).



Рисунок 1.5. Выделенные водородные связи в структуре β-листа.

Совмещение структур 2QCX и структурных гомологов

С помощью сервиса PDBeFold были выбраны 4 структурных гомолога 2QCX: 1UDD, 2GM7, 2Q4X. Для гомологов 2QCX и самого белка были загружены выравнивание последовательностей по совмещению структур (попарное и множественное) и само совмещение структур представлено на рисунке 2.1:

Рис. 2.1: совмещение структур гомологов 2QCX в JMol, предоставляемое сервисом PDBeFold

Выравнивание по структуре (большие буквы в файле с выравниванием) можно сравнить с выравниванием последовательностей, выполненным, например, в программе JalView (с помощью Tcoffee со стандартными параметрами):

Рис. 2.2: Выравнивание последовательностей гомологов 2QCX в JalView; окраска по Сlustalx.
Рис. 2.3: Выравнивание по структуре гомологов 2QCX в JalView; окраска по Сlustalx.

При сравнении множественного выравнивания последовательностей и выравнивания последовательностей по структуре удаётся выявить несколько различий. Так, в выравнивании по последовательности Glu150 выравнивается с Gly150, в выравнивании по структуре мы такого не наблюдаем. Можно отметить, что все найденные несоответствия наблюдаются именно в неструктурированных участках (или иногда захватывают граничные остатки элементов вторичной структуры) и отсутствуют в спиралях или β-тяжах.

При попытках визуализировать подобные несоответствия возникли проблемы с сохранением информации из интернет-версии Jmol. К сожалению, исправить проблему не удалось.


Рис. 2.4: Фрагменты выравниваний, где наблюдаются различия.

Поиск структурных гомологов для домена 1cii A: 284-384

В сервисе PDBeFold был осуществлен поиск стрктурных гомологов для домена 1cii A: 284-384. Однако сам этот домен найден не был. На рисунке 2.5 показана выдача с сайта. Результаты отсортированы по RMSD.

Рисунок 2.5. Результат поиска структурных гомологов для домена 1cii A: 284-384 в PDBeFold.

Совмещение по заданному выравниванию

Для выполнения данного заданий были выбраны структуры константного домена человеческого Т-клеточного рецептора из цепи α (1kgc, region d:118-206) и из цепи β (1kgc, region e:119-247) (рисунок 2.6). .


Рисунок 2.6. Домены человеческого Т-клеточного рецептора из цепи α и из цепи β.

С помощью сервиса SheeP были получены карты бета-листов доменов (рисунки 2.7-2.9).


Рисунок 2.7. Карта бета-листа для домена из цепи α (map0).


Рисунок 2.8. Карта бета-листа для домена из цепи β (map0).


Рисунок 2.9. Карта бета-листа для домена из цепи β (map1).

Карты этих листов находятся в одной ориентации.

Было построено выравнивание этих листов. Консервативные цистеины должны оказаться выровненными. Их выравнивание задает выравнивание всего центрального тяжа. Для совмещения были взяты по 6 остатков из каждого тяжа, так, чтобы консервативные остатки были в одинаковых позициях. Для совмещения использовалась команда:

select alph, alpha and name CA and resi (137-142+177-180)
select bet, beta and name CA and resi (146-151+192-195)
pair_fit alph, bet

Ниже приведено изображение участков совмещенных структур.


Рисунок 2.10. Совмещение доменов T-клеточного рецептора. Большинство тяжей совпадает.

Нахождение гидрофобных кластеров

С помощью сервиса Clud в структуре 4FXJ был произведён поиск гидрофобных кластеров. Со значениями 5.4 и 3 для порога расстояния и размера кластера, соответственно, было найдено 2 кластера, охватывающих сразу всю структуру и две ее цепи (рис. 3.1 и 3.2, соответственно). Также было обнаружено 7 гидрофобных кластеров в каждой из цепей, в силу их симметричности была рассмотрена только цепь А (рис. 3.3). Пожалуй, можно сказать, что найденные кластеры отвечают группам (с одним и более) элементов вторичной структуры белка, определяемым визуально.



Рисунок 3.1. Гидрофобный кластер в структуре 4FXJ.



Рисунок 3.2. Гидрофобный кластер в структуре 4FXJ.



Рисунок 3.3. Гидрофобные кластеры в структуре 4FXJ (цепь А).

Поиск гидрофобных кластеров в димере белка 3HNW (цепях A и B структуры с мотивом coiled coil) позволяет различить гидрофобные кластеры в участках контакта двух спиралей (значения для порога расстояния и размера кластера – 4.5 и 5, соответственно) (рис. 3.4).



Рисунок 3.4. Гидрофобные кластеры в участках контакта спиралей в структуре 3HNW.

Построение поверхности, раскраска участка поверхности: pymol

Для комплекса димера пуринового репрессора с ДНК (биологическая единица 1JH9) с использованием средств программы PyMol были созданы изображения, демонстрирующие контакт мономеров белка и между собой и контакт белка с ДНК. Контакты поверхности мономера белка с симметричным мономером и с двойной спиралью ДНК представлены на рисунках 4.1-4.3.



Рисунок 4.1. Изображение поверхности контакта мономера белка с симметричным мономером (область контакта выделена красным цветом) на фоне остовной (ribbon) модели мономеров.



Рисунок 4.2. Изображения поверхности контакта (область контакта выделена красным цветом) димера белков с двойной спиралью ДНК на фоне остовной модели части белка, вовлечённой в контакт, полученные с разных ракурсов.



Рисунок 4.3. Изображения поверхности контакта ДНК (область контакта выделена красным цветом, и атомы представлены в виде сфер) с димером белков на фоне проволочной (sticks) модели двойной спирали.

С помощью сервиса Clud в структуре 1JH9 были определены гидрофобные кластеры объёмом не менее 10 атомов на интерфейсе мономеров белка (distance threshold – 5 Å) (рис. 4.4).



Рисунок 4.4. Изображение гидрофобных кластеров на поверхности контакта мономера белка с симметричным мономером (кластеры показаны различными цветами).

Сравнение доменов SCOP/SCOPe, ECOD, CATH и Pfam

Для структуры 1E0T был произведен поиск доменов в Pfam, SCOPe, ECOD и CATH. Структура 1E0T - R292D мутантная пируват киназа E. coli, гомотетрамер, сотоящий из четырех одинаковых субъединиц (A, B, C и D). Указанные ниже домены найдены для цепи A, и совпадают с доменами для остальных цепей.
Домены, найденные Pfam: домен PK с координатами 1-345 и домен PK_C с координатами 356-468.
Домены, найденные SCOPe: домен d1e0ta1 с координатами 70-167, домен d1e0ta2 с координатами 1-69 и 168-344 и домен d1e0ta3 с координатами 454-470.
Домены, найденные CATH: домен 1e0tA01 с координатами 336-467, домен 1e0tA02 с координатами 2-69 и 169-335 и домен 1e0tA03 с координатами 70-168.
Домены, найденные ECOD: домен e1e0tA4 с координатами 1-70 и 169-344, домен e1e0tA1 с координатами 70-167 и домен e1e0tA3 с координатами 354-470.


Рисунок 5.1. Разметка структуры на домены Pfam, SCOPe, CATH и ECOD.

И по координатам доменов, и по рисунку, видно, что домены в Pfam и SCOPe совпадают не полностью. В данном случае Pfam объединил два домена, найденных SCOP, это странно, потому такой домен содержит два β-бочонка (можно предполагать, что они являются центрами двух различных функциональных доменов). Второй домен - укладка Россманна, найденный Pfam соответствует третьему домену, найденному SCOP, но он короче и лежит внутри него. SCOPe идеально совпадает с ECOD. Сервис Pfam осуществляет поиск функциональных доменов, а SCOP - структурных. Предсказания CATH - практически совпадают с предсказаниями SCOPe.

Использование сайта PDB

Задача 1. Скачайте все последовательности белков, структуры которых определенны при помощи метода электронной микроскопии

Используя Advanced search были заданы параметры, а именно нужный нам метод ELECTRON MICROSCOPY. Было найдено 917 структур, определенных этим методом.

Информацию о последовательностях белков можно найти тут.

Сравните список структурных гомологов, определенных для вашего белка программой PDBeFold с таким же списком из программы jFATCAT

С помощью сервиса PDBeFold была получена информация о всех структурных гомологах белка 2QCX; таких гомологов оказалось всего 137 для всех цепей белка. Информация о гомологах.

Также был получен список гомологов 2QCX с помощью программы jFATCAT, которая доступна со страницы PDB. Далее возникли некоторые сложности с сохранением результатов из FATCAT. В итоге выдача была сохранена в формате .xlsx. Следует отметить, что на странице PDB выдача FATCAT представляется не в лучшем виде, абсолютно не читаемые IDs. Поэтому по средствам Ecel эти IDs были приведены к нормалному виду. После этого было проведено сравние результатов, полученных двумя сервисами. Было обнаружено всего 5 совпадений.

Excel - таблица.

© Nosikova Kate, 2012