МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИМЕНИ М.В.ЛОМОНОСОВА
ФАКУЛЬТЕТ БИОИНЖЕНЕРИИ И БИОИНФОРМАТИКИ

Домашняя страничка Ильи Курочкина

Главная

I Семестр

II Семестр

III Семестр

IV Семестр

V Семестр

Проекты

Обратная Связь

SCOP и CATH

    CATH, не выдал классификация доменов, данного мне белка 1KSK (написал, что домены находится на HOMCHECK_REVIEW flow stage). Поэтому я взял два других белка: 1JHF и 4TMK.

  • 1) Классификация доменов записей PDB 1JHF и 4TMK согласно SCOP

    С помощью SCOP было найдено 2 домена в записи 1JHF:

    Первый из них - N-концевой домен репрессора LexA из E. coli (LexA repressor, N-terminal DNA-binding domain from Escherichia coli):
    • Расположен в цепи А белка 1JHF, занимает в цепи позиции 2-72.
    • Классификация по SCOP: класс - All alpha proteins; укладка - DNA/RNA-binding 3-helical bundle; суперсемейство - "Winged helix" DNA-binding domain; семейство - LexA repressor, N-terminal DNA-binding domain.
    • Суперсемейство ДНК-связывающий домен содержащий "крыло", небольшой бета-слой ("Winged helix" DNA-binding domain) содержит 84 семейства.
    • Укладку ДНК/РНК-связывающий 3-спиральный "пучок" (DNA/RNA-binding 3-helical bundle) содержит 14 суперсемейств.

    Второй из них - С-концевой домен белка LexA из E. coli (LexA C-terminal domain from Escherichia coli), имеется две копии данного домена:
    • Расположен в цепи A белка 1JHF, занимает в цепи позиции 73-198 (А также в цепи В, занимает всю цепь целиком).
    • Классификация по SCOP: класс - All beta proteins; укладка - LexA/Signal peptidase; суперсемейство - LexA/Signal peptidase ; семейство - LexA-related.
    • Суперсемейство LexA/Сигнальных пептидаз (LexA/Signal peptidase) содержит 2 семейства.
    • Укладку LexA/Сигнальных пептидаз (LexA/Signal peptidase) содержит 1 суперсемейство.

    Возьмем для дальнейшего исследования запись 4TMK (белок KTHY из E. coli). Согласно SCOP белок состоит из 1 домена - Тимидилат киназа из E. coli (Thymidylate kinase from Escherichia coli):
    • Расположен в цепи А белка 4TMK, занимает всю цепь целиком;
    • Классификация по SCOP: класс - альфа/бета белки (Alpha and beta proteins (a/b)); укладка - нуклеозидтрифосфат-гидролаз, содержащих P-петлю (P-loop containing nucleoside triphosphate hydrolases); суперсемейство - нуклеозидтрифосфат-гидролаз, содержащих P-петлю (P-loop containing nucleoside triphosphate hydrolases); семейство - нуклеотид и нуклеозид киназ (Nucleotide and nucleoside kinases).
    • Суперсемейство нуклеозидтрифосфат-гидролаз, содержащих P-петлю (P-loop containing nucleoside triphosphate hydrolases), содержит 24 семейства.
    • Укладку нуклеозидтрифосфат-гидролаз, содержащих P-петлю, (P-loop containing nucleoside triphosphate hydrolases) содержит 1 суперсемейство.

  • 2) Классификация доменов записей PDB 1JHF и 4TMK согласно CATH

    С помощью CATH было найдено 3 домена в записи 1JHF, домены 1jhfA01 и 1jhfB00 это фактически один и тот же домен, но CATH распознает их по разному, так как они расположены на разных цепях. Поэтому рассмотрими один из них, а именно - 1jhfA01:

    Первый из них - домен 1jhfA01:
    • Расположен в цепи А белка 1JHF, занимает в цепи позиции 80-198.
    • Классификация по CATH: 2.10.109.10.1.1.1.1.2
    • Класс - Mainly Beta; архитектура - Ribbon; топология - Umud Fragment, subunit A; суперсемейство - Umud Fragment, subunit A.
    • В данном суперсемействе содержится 4 семейства.
    • Данную топологию имеют 1 суперсемейство.

    Второй из них - домен 1jhfA02:
    • Расположен в цепи А белка 1JHF, занимает в цепи позиции 2-70.
    • Классификация по CATH: 1.10.10.10.37.1.1.1.1
    • Класс - Mainly Alpha; архитектура - Orthogonal Bundle; топология - Arc Repressor Mutant, subunit A; суперсемейство - "winged helix" repressor DNA binding domain.
    • В данном суперсемействе содержится 174 семейства.
    • Данную топологию имеют 37 суперсемейств.

    Для записи 4TMK CATH определил 1 домена - 4tmkA00:
    • Расположен в цепи А белка 4TMK, занимает в цепи позиции 2-211.
    • Классификация по CATH: 3.40.50.300.39.1.1.1.1
    • Класс - Alpha Beta; архитектура - 3-Layer(aba) Sandwich; топология - Rossmann fold; суперсемейство - P-loop containing nucleotide triphosphate hydrolases.
    • В данном суперсемействе содержится 208 семейства.
    • Данную топологию имеют 120 суперсемейств.

  • 3) Различия между CATH и SCOP в описании доменов записей 1JHF и 4TMK

    Доменная организация белка записи 1JHF определена в CATH и SCOP одинаково.
    Доменная организация белка записи 4TMK определена в CATH и SCOP одинаково.

    N-концевой домен белка 1JHF определен в CATH и SCOP практически одинаково (за исключением того, что в SCOP его укладка называется ДНК/РНК-связывающий 3-спиральный "пучок", а в CATH топология называется "Мутантный Арк репрессор"; суперсемейства, следующие далее по классификации, для этого домена по CATH и SCOP совпадают).

    Уровни С-концевого домен белка белка 1JHF по CATH и SCOP называются по-разному. Укладка этого домена по SCOP - "LexA/Сигнальные пептидазы"; топология по CATH - "Umud фрагмент, субъединица A". Суперсемейство по SCOP - "LexA/Сигнальные пептидазы"; суперсемейство по CATH - "Umud фрагмент, субъединица A".

    Домен записи 4TMK описанный в CATH и SCOP практически одинаково (за исключением того, что в SCOP его укладка называется "нуклеозидтрифосфат-гидролазы, содержащие P-петлю", а в CATH топология называется "укладка Россманна"; суперсемейства, следующие далее по классификации, для этого домена по CATH и SCOP совпадают).

    Некоторые домены имеют разную классификацию в CATH и SCOP.
    Домен 1je8E00 из записи 1JE8, имеющий согласно CATH относится к тому же суперсемейству, что и N-концевой домен белка 1JHF ("winged helix" repressor DNA binding domain), но не входит в то же суперсемейство согласно SCOP (не "winged helix" repressor DNA binding domain, а C-terminal effector domain of the bipartite response regulators).

    Причинами таких различий в доменной классификации могут быть:
    • Дата последнего релиза: у CATH не известна, но значительно позже - 7 июля 2009 года, в то время как SCOP последний раз обновлялся в июне 2009).
    • Разное количество уровней: в SCOP их значительно меньше, чем в СATH.

  • 4) Выравнивание доменов, имеющих одну укладку по SCOP (или топологию по CATH), но состоящих в разных суперсемействах

    Построим выравнивание двух доменов с одной укладкой по SCOP, но из разных суперсемейств. Для задания были выбраны цепь А записи 1jhf и цепь А записи 1sfe. Оба домена имеют укладку ДНК/РНК-связывающий 3-спиральный "пучок" (DNA/RNA-binding 3-helical bundle), но первый из них принадлежит суперсемейству: "Winged helix" DNA-binding domain, а второй - суперсемейству: Methylated DNA-protein cysteine methyltransferase, C-terminal domain . Воспользуемся программой PDBeFOLD (SSM). На выходе получаем файл с жестким выравниванием последовательностей в формате fasta 1jhf_1sfe.fasta. Подадим его на вход программе Geometrical core для нахождения геометрического ядра с порогом 1.5Å. На выходе получаем таблицу с остатками из структур, образующими геометрическое ядро:

    Pos. 1JHF_A 1SFE_A
    82 LEU4 GLY93
    83 THR5 THR94
    84 ALA6 ALA95
    85 ARG7 PHE96
    86 GLN8 GLN97
    87 GLN9 GLN98
    88 GLU10 GLN99
    89 VAL11 VAL100
    90 PHE12 TRP101
    91 ASP13 GLN102
    92 LEU14 ALA103
    93 ILE15 LEU104
    94 ARG16 ARG105
    95 ASP17 THR106
    106 ARG28 TYR115
    107 ALA29 GLN116
    108 GLU30 GLN117
    109 ILE31 LEU118
    111 GLN33 ASN120
    112 ARG34 ALA121
    115 PHE37 LYS124

    Совместим в PyMOL командой pair-fit структуры по Cα-атомам, входящим в геометрическое ядро. В результате получаем следующее изображение совмещенных структур:

    Красным на рисунке окрашена цепь А записи 1jhf, синим - цепь А записи 1sfe. Светло-красным окрашены остатки цепи А записи 1jhf, входищие в состав геометрического ядра; светло-синим - остатки цепи А записи А записи 1sfe, входищие в состав геометрического ядра. RMSD совмещения по геометрическому ядру составляет 0.849 (21 to 21 atoms). Значение RMSD достаточно хорошее, что говорит об успешном выравнивании и совмещении доменов.

    Построим выравнивание двух доменов с одной топологией по CATH, но из разных суперсемейств. Для задания были выбраны цепь А записи 4tmk и цепь А записи 1c0p. Оба домена имеют топологию "укладка Россманна" (Rossmann fold), но первый из них принадлежит суперсемейству: P-loop containing nucleotide triphosphate hydrolases, а второй - суперсемейству: NAD(P)-binding Rossmann-like Domain. Воспользуемся программой PDBeFOLD (SSM). На выходе получаем файл с жестким выравниванием последовательностей в формате fasta 4tmk_1c0p.fasta. Подадим его на вход программе Geometrical core для нахождения геометрического ядра с порогом 1.5Å. На выходе получаем таблицу с остатками из структур, образующими геометрическое ядро:

    Pos. 1C0P_A 4TMK_A
    10 VAL1008 VAL7
    11 VAL1009 ILE8
    12 LEU1010 GLU9
    23 ALA1020 ARG20
    24 LEU1021 ASN21
    25 ILE1022 VAL22
    26 LEU1023 VAL23
    101 HIS1031 GLY98
    102 ILE1032 ASP99
    243 ASP1173 ASP134
    244 LEU1174 LEU135
    245 VAL1175 THR136
    246 VAL1176 LEU137
    247 ASN1177 TYR138
    440 GLN1340 PRO192
    444 ALA1344 VAL196
    450 GLN1350 THR202
    451 LEU1351 THR203
    452 VAL1352 VAL204
    453 ASP1353 THR205
    454 GLU1354 HIS206
    455 ALA1355 TRP207
    456 PHE1356 VAL208
    457 GLN1357 LYS209
    458 ARG1358 GLU210

    Совместим в PyMOL командой pair-fit структуры по Cα-атомам, входящим в геометрическое ядро. В результате получаем следующее изображение совмещенных структур:

    Красным на рисунке окрашена цепь А записи 4tmk, синим - цепь А записи 1c0p. Светло-красным окрашены остатки цепи А записи 4tmk, входищие в состав геометрического ядра; светло-синим - остатки цепи А записи А записи 1c0p, входищие в состав геометрического ядра. RMSD совмещения по геометрическому ядру составляет 0.902 (25 to 25 atoms). Значение RMSD достаточно хорошее, что говорит об успешном выравнивании и совмещении доменов. Но все же в данном случае домены выравнялись хуже, чем в предыдущем случае.

    Таким образом, можно сделать вывод, что домены, имеющие одинаковую укладку (топологию), но входящие в разные суперсемейства, все же имеют достаточно сходную пространственную структуру.


© 2008, Илья Курочкин