Анализ трехмерных структур
❧❧❧❧❧❧
Определение вторичной структуры белка
Определение вторичной структуры алгоритмами DSSP и Stride
Для структуры 4B3B было проведено выделение участков вторичной структуры программами DSSP и Stride . Результаты работы обеих программ доcтупны по ссылкам: Выдача DSSP и Выдача Stride. На рисунке 1 приведена таблица сравнения границ участков вторичной структуры для двух альфа-спиралей, двух бета-тяжей и одной 310 спирали. Алгоритмы описывают структуру схожим образом, однако иногда не включают крайние остатки, причём совпадение границ альфа-спиралей немного хуже, чем бета-тяжей, которые определены почти идеально.
Рис. 1 Таблица сравнения границ четырёх элементов вторичной структуры (двух бета-тяжей и двух альфа-спиралей) в заголовке файла pdb и выдаче программ DSSP и Stride. Нумерация атомов всюду как в файле PDB.
Построение карты бета-листа при помощи SheeP
С помощью программы SheeP была получена карта для бета-листа в pdb-файле 4B3B. (На самом деле SheeP находит 2 бета-листа в структуре, но один из них включает всего 4 остатка, сочтём это артефактом). Он состоит из девяти бета-тяжей (His199-Ala205, Ser167-Thr173, Lys233-Asp238, Ile277-Gln284, Gln131-Gly138, Thr310-Gly318, Gly321-Ile328, Glu337-Thr343, Gly346-Asp349) и является преимущественно параллельным, однако один из бета тяжей расположен антипараллельно (Gly321-Ile328, Gly346-Asp349). Карта выбранного листа представлена на рисунке 2, остатки, радикалы которых направлены в разные стороны от плоскости бета-листа показаны красным и жёлтым цветами на карте. На рисунке 3 приведён ряд изображений рассматриваемого элемента вторичной структуры.
Рис. 2 Карта бета-листа, полученная из выдачи программы SheeP.
Рис. 3 Слева направо: изображение из Jmol, полученное по ссылке из SheeP, изображения полученные с помощью Pymol - бета-лист и он же в контексте всего белка.
Покажем, что на карте бета-листа один столбец соответствует хребту из альфа атомов, для этого остатки одного столбца покрасим одним цветом. На рисунке 4 приведен рассматриваемый бета лист (с радикалами и без) с такой раскраской. Хотя бета-лист достаточно изогнут, всё же видно, что формирующиеся на поверхности бета-листа гребни состоят из остатков, определённых на карте в один столбец.
Рис. 4 Визуализация гребней в бета-листе. Остатки из одного столбца карты показаны одним цветом. Слева: бета-лист с боковыми радикалами В центре: положение "столбцов" таблицы в бета-листе Справа: бета-лист без радикалов с раскраской по столбцам.
Узнаем, какая из сторон бета-листа обращены внутрь белка (к гидрофобному ядру), а какая наружу - в гидрофильное окружение. Для этого сначала сравним набор аминокислот "красной" и "жёлтой" сторон листа по карте. На рисунке 5 приведена таблица, в которой показаны частоты гидрофильных (голубые и синие) и гидрофобных (красные) аминокислотных остатков на каждой стороне. Сделать заключение о том, какая сторона гидрофобнее, по этим частотам трудно, т.к. сильно гидрофобные/сильно гидрофобные остатки встречаются с обеих сторон, поэтому просуммируем частоты гидрофобных и гидрофильных аминокислот по каждой стороне (без учёта разницы в гидрофильности внутри групп). Таким образом, красная сторона гидрофобнее. Это видно и на рис. 6: "желтые остатки" действительно выходят на поверхность. На этом же рисунке видно, что часть листа не выходит на поверхность никакой стороной, этим и объясняется схожая гидрофобность сторон в целом.
Рис. 5 Распределение аминокислотных остатков разной степени гидрофильности по сторонам бета-листа. Стороны обозначены как жёлтая (Yel) и красная (Red) в соответствии с картой бета-листа (см. Рис.2), гидрофобные аминокислотные остатки показаны красным, а гидрофильные синим.
Рис. 6 Остатки двух сторон бета-листа на поверхности структуры всего белка. Видно, что наружу обращены преимущественно жёлтые остатки.
С помощью Stride был получен список водородных связей, они показаны на рисунке 8. Это связи N-H...O между соседними бета-тяжами. Нерегулярности есть только на краю листа (неправильные связи, две водородные связи с одним кислородом)
Рис. 7 Водородные связи в пределах бета листа. Образующие связи атомы показаны шариками (красные - кислород, синие - азот). В зелёном круге - нерегулярность на краю листа.
❧❧❧❧❧❧
Совмещение структур
Совмещение структуры белка и его гомологов
Выравнивались четыре гомолога структуры 4b3b, найденные с помощью PDBeFold - 4qkq (RadA из Methanococcus voltae ), 2zts (RadC из Pyrococcus horikoshii),
4wia (FlaH из Methanocaldococcus jannaschii), 4hyy (человеческая DMC1 рекомбиназа) и сама структура 4b3b. Интересно, что поиском со стандартными
параметрами не находятся структуры бактериальных RecA, хотя и находятся разные архейные паралоги RadA. Изображения пространственного выравнивания см. на рис. 8-9.
Рис. 8 Структурное выравнивание 4b3b и его гомологов, выполненное при помощи PDBeFold и визуализированное при помощи Jmol (онлайн-сервис).
Легенда: 4b3b - зелёный, 4qkq - синий, 2zts - голубой , 4wia - жёлтый, 4hyy - розовый.
Рис. 9 Структурное выравнивание 4b3b с четырьми его структурными гомологами (слева) и соотнесение элементов вторичной структуры. Визуализация Pymol. Легенда на изображении
Выравнивание, полученное из совмещения 3D-структур белка RadA (4b3b) и его гомологов, приведено ниже (рис. 10). Также было получено выравнивание по последовательностям
(MUSCLE) - см. рис. 11.
Рис. 10 Выравнивание, полученное из совмещения 3D-структур белка RadA (4b3b) и его гомологов. Раскраска по консервативности позиций.
Рис. 11 Выравнивание последовательностей белка RadA (4b3b) и его гомологов (MUSCLE). Раскраска по консервативности позиций.
Выравнивания в целом идентичные, за исключением продолжительного участка последовательности белка, структура которого обозначена как 2zts, который сдвинут в выравнивании, полученном с помощью MUSCLE. На рисунке 12 можно видеть, что этот участок (показан красным) в целом хорошо накладывается на остальные структуры, так что имеет смысл верить скорее выравниванию, полученному из структурных соображений.
Рис. 12 Положение в структурном выравнивании участка 2zts, по разному выравнивающегося структурно и последовательности алгоритмом MUSCLE (показан красным).
Визуализация Pymol. Представление ribbons (по С-альфа атомам).
Раскраска структур как на рис. 9.
Поиск по сходству структур в PDBeFold
Был произведён поиск структурных гомологов с помощью сервиса PDBeFold для домена 1b0m A:203-315 (параметры по умолчанию), затем результаты отсортированы по RMSD. В выдаче присутствует 43 структуры, однако самой 1b0m не обнаружено. Причина, вероятно, в том, что порог - процент общих элементов вторичной структуры, и если белок имеет сложную доменную структуру и достаточный размер, общих элементов с каждым доменом, особенно небольшим, будет немного. Порог sse по умолчанию - 70%, то есть при стандартных параметрах это должно хорошо работать для доменов, занимающих "больше половины" белка.
Совмещение по заданному выравниванию
Из первой в списке SCOP PDB структуры - 1OGA были получены два PDB-файла, соответствующие альфа-цепи (D:118-202) и бета-цепи (E:119-245) константного домена T-клеточного рецептора. Для них были получены карты бета листов при помощи программы SheeP (см. рис 13-14). Верхнему листу в цепи бета соответствует лист из альфа.
1ogaРис. 13 Карта бета листа из альфа-цепи константного домена Т-клеточного рецептора (Sheep). Из 2х бета-листов выбран интересующий.
Рис. 14 Карта бета листа из бета-цепи константного домена Т-клеточного рецептора (Sheep).
Далее бета-листы были выровнены по консервативным цистеинам и окружающим остаткам командой
pair_fit alpha and name ca and resi 133-135, beta and name ca and resi 144-146
Рис. 15 Cовмещение структур двух бета-листов альфа (показана зелёным) и бета (показана голубым) цепей Т-клеточного рецептора, построенное на основе совмещения консервативного цистеина и соседних консервативных остатков.
При использовании ещё и других остатков из тех же хребтов выравнивание несколько улучшается, однако не кардинально (см. рис. 16): Совмещённые структуры (pdb)
Команда pymol: pair_fit alpha and name ca and (resi 133-135 or resi 121-123 or resi 174-176 or resi 154-156), beta and name ca and (resi 144-146 or resi 126-128 or resi 191-193 or resi 171-173)
Рис. 16 Cовмещение структур двух бета-листов альфа (показана зелёным) и бета (показана голубым) цепей Т-клеточного рецептора, построенное на основе совмещения консервативного цистеина, соседних консервативных остатков, а также тех остатков, которые входят в те же хребты, что и консервативные остатки.
❧❧❧❧❧❧
Нахождение гидрофобных кластеров
Поиск гидрофобных кластеров в структуре белка
Для работы была выбрана структура мышиного Apaf-1 c pdbid 3SFZ. Доменная структура белка чётко подразделяется на 5 доменов, 4 из которых присутствуют в выбранной структуре. С помощью программы Clud определялись гидрофобные кластеры в структуре белка. Наиболее удачного соответствие кластеров доменной структуре белка удалось добиться при пороге в 4.7 Å (Рис.17). Стоит отметить, что домены белка могут быть функционально разделены на поддомены, что отражается тем фактом, что для всех доменов, кроме линкерного, при варьировании программа выделяет больше одного кластеров. Так, каждый из бета-пропеллеров состоит из повторяющихся единиц, и в части из них программа находит самодостаточные кластеры, а часть объединяет с другими единицами. При более высоких значениях порога уже происходит объединение кластеров, принадлежащих к разным доменам.
Рис. 16 Гидрофобные кластеры в структуре Apaf-1.
Снизу: доменная структура Apaf-1 без CARD-домена. Домен NB-ARC представлен синим, линкерный - жёлтым, бета-пропеллеры 1 и 2 - красным и зелёным соотвественно.
Сверху: гидрофобные кластеры, выделяемые Clud в структуре 3sfz при пороге 4.7 Å. Оранжевый кластер соответствует линкерному домену и части NB-ARC, розовый - одному из поддоменов NB-ARC, остальные кластеры - WD-повторам в составе бета-пропеллеров.
Интересно, что в двух схожих доменах (бета-пропеллерах) кластеры определяются по разному и в одном из них группируется больше повторов, чем в крупнейшем кластере второго бета-пропеллера.
Поиск гидрофобных кластеров на интерфейсе двух цепочек
Была предпринята попытка найти гидрофобный кластер на контактирующих частях Apaf-1 и каспазы-9, но она не увенчалась успехом. Поэтому был выбран другой белок. Использовалась структура (pdb id 3V6I) - субъединицы E и G протонной АТФ-синтазы из Thermus thermophilus (компоненты "статорной ручки"). На рисунке 18 приведены кластеры, найденные при пороге 5.0 Å и без ограничений на размер кластера.
Рис. 18 Гидрофобные кластеры на интерфейсе между субъединицами E и G архейной АТФ-синтазы. a: взаимодействие между двумя гетеродимерами (в реальных условиях такой комплекс не образуется). Гидрофобный кластер показан в рамке. b: гидрофобные кластеры в местах контакта субъединиц. По неясной причине программа или членит гидрофобный интерфейс на много маленьких кластеров, или же находит только усечённый кластер с одной стороны контакта (в зависимости от величины порога).
❧❧❧❧❧❧
Построение поверхности, раскраска участка поверхности
Для структуры комплекса пуринового репрессора с ДНК (2PUD) были получены изображения поверхностей областей контактов между макромолекулами (рис 19-21). Второй мономер в димере и вторая цепь ДНК были получены в pymol командой symexp (полная структура).
Рис. 19 поверхность контакта мономера пуринового репрессора с симметричным мономером на фоне остовной (ribbon) модели мономера.
Сверху: изображение поверхности контакта между двумя мономерами, принадлежащей одному из мономеров.
Снизу: то же, один из мономеров скрыт.
Раскраска поверхности по элементам.
Рис. 20 Поверхность контакта димера белков с двойной спиралью ДНК на фоне остовной модели части белка, вовлечённой в контакт.
Раскраска поверхности по элементам.
Рис. 21 поверхности контакта ДНК с димером белков на фоне проволочной (sticks) модели двойной спирали.
Раскраска поверхности по элементам.
К сожалению, по неясной причине CluD не находит гидрофобные кластеры на интерфейсе мономеров ни при одном из порогов.
❧❧❧❧❧❧
Сравнение доменов SCOP/SCOPe, ECOD, CATH и Pfam
Возьмём тот же белок, что и в предыдущем задании (пуриновый репрессор, структура 2pud).
PfamБыли найдены два домена, LacI с координатами 4-49 и Peripla_BP_3 с координатами 171-332.
SCOPe
Были найдены два домена,
первый с координатами 3-58 и
второй с координатами 59-340.
СATH
Были найдены три домена,
2pudA01
с координатами 3-59, 2pudA02, повторяющийся 2 раза (60-161, 292-323) и
2pudA03 2pudA03, также повторяющийся 2 раза то же (162-291, 324-340)
Как и в CATH, нашлось три домена, но без повторений (рис. 22)
Рис. 22 Выдача ECOD
Сравнение доменов, найденных разными способами
- Всеми способами был найден N-концевой домен (показан красным в сравнительной таблице на рис. 23), границы его различаются незначительно для всех случаев.
- Второй домен - "оранжевый" не нашёлся в Pfam, а в Scope он объединен с третьим ("зеленым"). В CATH и ECOD его границы совпали.
- "Оранжевый" и "зелёный" домены схожи и скорее всего представляют собой дупликацию одного домена. CATH находит повторы (неполные) тех же доменов на С-конце белка, возможно, это отражает эволюционную историю доменов - некую модульную организацию системы из 2 и 3 домена, а возможно, эти участки распознаются, как принадлежащие другому типу доменов просто потому, что домены 2 и 3 очень схожи между собой. В целом, для сложной система из повторяющихся, но не идентичных единиц все способы дают разный результат.
- Кроме того, Pfam не имеет в качестве задачи расчленение всего белка на домены без остатка, поэтому домены Pfam короче доменов, полученных другими способами.
- В качестве компромиссного выберем вариант из ECOD (рис. 24), он хорошо соответствует визуально различимым доменам и не представляет собой слишком мелкое членение.
Рис. 23 Сравнение границ доменов, полученных разными способами
Рис. 24 Домены ECOD для пуринового репрессора (структура 2pud).
Раскраска соответственно доменам в таблице (рис. 23)
❧❧❧❧❧❧
Использование сайта PDB
Получение последовательностей белков, структуры которых определены при помощи метода электронной микроскопии
На странице ADVANCED SEARCH был выбран фильтр "experimental method" с опцией "electron microscopy", нашлось 928 структур, для них были скачаны последовательности (18232, включая повторяющиеся, но идентичные, субъединицы).
Пример белков, для которых гибкое структурное выравнивание включает существенно больше остатков, чем жесткое
Были выбраны структуры рибосомных белков L1 из Methanococcus jannaschii и Thermus thermophilus (мутантный). Жесткое структурное выравнивание было произведено с помощью PDBeFold (результат), а гибкое - сервера FATCAT (результат, потребовалось 2 "твиста"). jFATCAT c сайта PDBe не использовался, т.к. при запуске апплета возникли проблемы. Сравнение результатов приводится в таблице 1, сравнение 2х выравниваний - на рис. 25. Видно, что структуры гораздо лучше совмещаются при применении гибкого структурного выравнивания.ТАБЛИЦА 1. Сравнение совмещения структур разными методами
Метод | RMSD | Число выравненных остатков | Процент выравненных (по 1cjs) |
Процент выравненных (по 1ad2) |
Жёсткое выравнивание | 2.576 | 130 | 61% | 58% | Гибкое выравнивание | 2.26 | 195 | 87,5% | 87% |
Рис. 25 Жёсткое (сверху) и гибкое (снизу) выравнивание 1cjs и 1ad2.