Демонстрация навыков.

Быстрый переход к:
d1. Определение вторичной структуры.
d2. Совмещение структур.
d3. Нахождение гидрофобных кластеров.
d4. Построение поверхности.
d5. Сравнение доменов SCOP и Pfam.

d1: Определение вторичной структуры.

Для выполнения задания была взята структура 4D7S. На рисунке 1.1 представлена разметка данной структуры, исходя из аннотации в .pdb-файле.


Рисунок 1.1. Разметка вторичной структуры 4D7S в .pdb-файле. Голубым цветом обозначены α-спирали, коричневым - β-тяжи.

Для предсказания вторичной структуры использовалась программа DSSP. Результаты работы этой программы и сравнение их с разметкой в .pdb-файле приведены в таблице 1.
Таблица 1. Результаты определения границ элементов вторичной структуры программой DSSP для цепи A структуры 4D7S.
Аннотация PDB Разметка DSSP
α-спираль
1228-246229-245
2249-267250-266
3271-277272-276
4280-292281-291
5292-299293-298
6306-314307-313
7315-317 
8368-373369-372
9393-404394-403
10404-420405-419
β-тяж
1318-322318-322
2327-329327-329
3338-343338-343
4346-349346-349
5356-360356-360
6365-366365-366
7380-383380-383
8387-392387-392
Легко заметить, что границы α-спиралей не совпадают в разметках PDB и DSSP (DSSP не вкючает в α-спираль крайние остатки, размеченные PDB, поэтому все границы смещены на 1 остаток). Так же видно, что одна короткая спираль, состоящая из трех остатков в PDB не была найдена DSSP.В то же время разметка для всех β-тяжей полностью совпала.
С помощью сервиса SheeP была построена карта бета-листа для данной структуры.


Рисунок 1.2. Карта β-листа для структуры 4D7S.

По карте видно, что лист (рисунок 1.3) состоит из четырех β-тяжей (строки в таблице).


Рисунок 1.3. β-лист структуры 4D7S, состоящий из четырех тяжей, выделен голубым цветом.

Один стробец карты, приведенной на рисунке 1.2, соответствует одному хребту β-листа. На рисунке 1.4 выделены Cα-атомы хребта, соответствующего четвертой колонке.


Рисунок 1.4. β-лист структуры 4D7S, Cα-атомы аминокислот, образующих один из хребтов, обозначены шариками.

d2: Совмещение структур.

Совмещение структуры 4IP7 и структурных гомологов

С помощью сервиса PDBeFold были выбраны 4 структурных гомолога для цепи A структуры 4IP7: 2G50:B, 4HYV:A, 4QG9:D, 4FXJ:A. Для данных структур были загружены выравнивание последовательностей по совмещению структур (попарное и множественное) и само совмещение структур (рисунок 2.1).


Рисунок 2.1. Совмещение структур 4IP7:A и его структурных гомологов, полученной с помощью сервиса PDBeFold.

Далее было произведено выравнивание программой JalView (с помощью Tcoffee со стандартными параметрами). Сравнение полных множественного выравнивания по структуре и множественного выравнивания можно посмотреть на рисунке 2.2. В целом выравнивания очень похожи, но можно найти некоторые несоответствия. Одно из них приведено на рисунке 2.3, где во множественном выравнивании по структуре в структуре 4IP7:A остаток Gly229 выровнен с остатками аспарагиновой кислоты, а во втором выравнивании этот остаток выравнивается с остатками аланина.


Рисунок 2.3. Несовпадающие участки выравниваний.

При попытке найти данный остаток в структуре 4IP7, на этом месте был обнаружен разрыв (рисунок 2.4). Если внимательно посмотреть на полученные выравнивания (рисунок 2.2), то можно заметить, что в структурном выравнивании не хватает аминокислотных остатков, присутствующих в выравнивании по последовательности. Эти остатки по каким-то причинам отсутсвтуют в .pdb-файле, хотя присутствуют в .fasta-файле на сайте PDB. Именно этим фактом обусловлены все различия в полученных выравниваниях.


Рисунок 2.4. Разрыв в структуре 4IP7 (синий цвет). Шариками обозначены C-α- атомы остатков, расположенных на границах разрыва. Можно заметить, что рядом в одной из гомологичных структур тоже есть разрыв.

Совмещение по заданному выравниванию

Для выполнения данного заданиы были выбраны структуры константного домена человеческого Т-клеточного рецептора из цепи α (1oga, region d: 118-202) и из цепи β (1oga, region e: 119 - 245) (рисунок 2.5). Были получены файлы: alpha.pdb и beta.pdb.


Рисунок 2.5. Домены человеческого Т-клеточного рецептора из цепи α и из цепи β.

С помощью сервиса SheeP были получены карты бета-листов доменов (рисунки 2.6-2.8).


Рисунок 2.6. Карта бета-листа для домена из цепи α (map0).


Рисунок 2.7. Карта бета-листа для домена из цепи β (map0).


Рисунок 2.8. Карта бета-листа для домена из цепи β (map1).

Консервативные остатки цистеина задают выравнивание центрального тяжа. Остатки, спаренные с консервативным цистеином, задают выравнивание соседних тяжей. Таким образом было построено выравнивание. Используя информацию о выровненных остатках, в программе PyMol было построено совмещение этих доменов(рисунок 2.9) с помощью команды:
select alph, alpha and name CA and resi (122+133+134+135+155+175)
select bet, beta and name CA and resi (127+144+145+146+172+192)
pair_fit alph, bet


Рисунок 2.9. Совмещение доменов T-клеточного рецептора. Общий ход полипептидной цепи совпадает.

d3: Нахождение гидрофобных кластеров.

Поиск гидрофобных кластеров в структуре 4IP7 проводился с помощью сервиса CluD. Так как структура представляет собой гомотетрамер, поиск кластеров сначала проводился только для цепи A. При значениях 5.4 для порога расстояния и 10 для минимального размера кластера было найдено 8 кластеров, изображенных на рисунке 3.1:


Рисунок 3.1. Найденные кластеры. 3 наиболее крупных кластера (больше 100 аминоксилотных остатков) изображены на отдельных структурах, остальные 5 изображены на одной структуре.

Если брать другие пороги размера кластера, то можно отсеять маленькие кластеры. Например, при пороге размера 100 в структуре обнаруживаются только первые три кластера из изображенных на рисунке 3.1.
Можно заметить, что некоторые домены оказались разбиты на несколько кластеров, например β-бочонок, представляющий отдельный домен, был разделен программой на 3 отдельных кластера (рисунок 3.2).


Рисунок 3.2. Структурный домен разбит на 3 отдельных кластера.

При изменении порога расстояния на 5.7 в структуре было выделено 4 кластера (рисунок 3.3).


Рисунок 3.3. 4 кластера, полученные при новых параметрах поиска.

При этом три кластера, показанные на рисунке 3.2 слились в один и охватили весь домен полностью (рисунок 3.4).


Рисунок 3.4. Один гидрофобный кластер соответствует домену белка.


Для анализа гидрофобных взаимодействий между цепями для той же структуры производился поиск гидрофобных кластеров сразу во всех цепях белка. Был установлен порог расстояния 4.5 и минимальный размер кластера 10. В результате было выявлено 2 симметричных гидрофобных кластера, общих для цепей A и D и для цепей B и C (рисунок 3.5).


Рисунок 3.5. Гидрофобные кластеры, общие для цепей A и D и для цепей B и C.

d4: Построение поверхности.

Для комплекса димера пуринового репрессора с ДНК (биологическая единица 2PUE, рисунок 4.1) в программе PyMol были созданы изображения контакта мономеров белка между собой (рисунки 4.2 и 4.3) и контакта белка с ДНК (рисунки 4.4-4.7).


Рисунок 4.1. Биологическая единица 2PUE. (Белочек прильнул к ДНКашечке)


Рисунок 4.2. Поверхность контакта (обозначена желтым цветом) одной из субъединиц белка со второй субъединицей.


Рисунок 4.3. Две субъединицы белка 2PUE и поверхность контакта между ними (обозначена желтым цветом).


Рисунок 4.4. Контакт димера пуринового репрессора с ДНК. На рисунке показана белковая поверхность контакта.


Рисунок 4.5. Белковая поверхность контакта с ДНК.


Рисунок 4.6. Контакт ДНК с димером пуринового репрессора. На рисунке показана поверхность ДНК, контактирующая с белком.


Рисунок 4.7. Поверхность ДНК, контактирующая с белком.

С помощью сервиса CluD в структуре 2PUE были определены гидрофобные кластеры объёмом не менее 10 атомов на поверхности мономеров белка (пороговое расстояние – 5 Å). На рисунке 4.8 показана поверхность контакта субъединиц белка. Участки поверхности, относящаяся к найденным гидрофобным кластерам обозначены различными цветами (коричневым, желтым, оранжевым и фиолетовым).


Рисунок 4.8. Поверхность контакта субъединиц белка. Каждый цвет соответствует гидрофобному кластеру, найденному Clud.

d5: Сравнение доменов SCOP и Pfam.

Для структуры 2VGB был произведен поиск доменов в Pfam и SCOPe. Структура 2VGB - пируваткиназа эритроцитов человека, гомотетрамер, сотоящий из четырех одинаковых субъединиц (A, B, C и D). Указанные ниже домены найдены для цепи A, и совпадают с доменами для остальных цепей.
Домены, найденные Pfam: домен PK с координатами 85-438 и домен PK_C с координатами 452-572.
Домены, найденные SCOPe: домен d2vgba1 с координатами 160-261, домен d2vgba2 с координатами 57-159 и 262-439 и домен d2vgba3 с координатами 440-573.


Рисунок 5.1. Разметка структуры на домены Pfam и SCOPe.

И по координатам доменов, и по рисунку, видно, что домены совпадают не полностью. Сервис Pfam осуществляет поиск функциональных доменов, а SCOP - структурных. В данном случае Pfam объединил два домена, найденных SCOP, это странно, потому такой домен содержит два β-бочонка (можно предполагать, что они являются центрами двух различных функциональных доменов). Второй домен, найденный Pfam соответствует третьему домену, найденному SCOP, но он короче и лежит внутри него.


© Наталья Ланина
e-mail: n.lanina@fbb.msu.ru

последний раз обновлялось: 6.3.15