Организм: Mus musculus.
Молекулы: белок (цепь A), две комплементарные цепи ДНК (С и D).
Цепь ДНК:
цепь C [1001] 5' - cgatgcgggtgca - 3'[1013] ||||||||||||| цепь D [1014] 3' - tgcacccgcatcg - 5'[1026]
Картинки:
Некоторая информация о структуре:
1ODH - струтура, отображающая связь GCM транскрипционного фактора и ДНК. GCM расшифровывается как "отсутствие клеток нейроглии"("Glia cell missing"). Прототипичные GCM белки дрозофилы управляют дифференциацию нейронного предшественника в клетку нейроглии. Но GCM белки млекопитающих вовлечены в развитие плаценты и паращитовидной железы. Все GCM белки имеют высоко консервативный участок из 150 аминокислот, отвечающий за связывание ДНК: GCM-домен. Представленная структура является GCM-доменом мыши, связанным с соответствующим октамером ДНК. GCM-домен проявляет необычные особенности фолдинга: он состоит из двух доменов, связанных через два структурных иона цинка. Исследована новая способность бета-листов узнавать ДНК: в 1ODH пятисложенный бета-лист выдается в большую бороздку ДНК перпендикулярно спирали ДНК.
Тип формы ДНК: В-форма.
Средние значние торсионных углов:
α (P - O5') | β (O5' - C5') | γ (C5' - C4') | δ (C4' - C3') | ε (C3' - O3') | ξ (O3' - P) | χ (C1' - N) | |
1ODH | -25.99 | 30.19 | 26.57 | 141.93 | -39.92 | -100.23 | -109.84 |
α (P - O5') | β (O5' - C5') | γ (C5' - C4') | δ (C4' - C3') | ε (C3' - O3') | ξ (O3' - P) | χ (C1' - N) | |
Деформ. | 158.4 | -158.8 | 169.0 | 139.5 | -155.5 | -144.4 | -122.7 |
С помощью
скрипта
получила данные и изображения ниже.
A | T | G | C | |
Major groove | N6 N7 C5 C6 C8 | C4 C5 C6 C7 O4 | C5 C6 C8 N7 O6 | C4 C5 C6 N4 |
Minor groove | C2 C4 N3 N9 | C2 C6 N1 O2 | C2 C4 N2 N3 N9 | N1 O2 |
Undefined | N1 | N3 | N1 | N3 |
Contact | Type | Number of contacts | Involved aa | Specific nt (nucplot) | |
Deoxyribose/protein | polar | 10 | 2 | ARG167 LYS160 | - |
Deoxyribose/protein | nonpolar | 8 | ALA104 CYS101 LYS160 ILE100 LEU72 PHE131 | - | |
Phosphate/protein | polar | 20 | 12 | ARG167 LYS107 LYS160 CYS101 ILE100 LYS73 ARG62 SER69 ARG54 LYS74 | - |
Phosphate/protein | nonpolar | 8 | LEU72 LYS160 ILE100 ALA99 LYS107 | G1008 G1009 C1018 | |
Major groove/protein | polar | 4 | 4 | ASN65 HIS67 | - |
Major groove/protein | nonpolar | 0 | - | - | |
Minor groove/protein | polar | 0 | 0 | - | - |
Minor groove/protein | nonpolar | 0 | - | - |
Полярные контакты дезоксирибоза - белок:
Неполярные контакты дезоксирибоза - белок:
Полярные контакты фосфат - белок:
Неполярные контакты фосфат - белок:
Полярные контакты большая бороздка - белок:
Неполярные контакты большая бороздка - белок:
Полярные контакты малая бороздка - белок:
Неполярные контакты малая бороздка - белок:
Получена такая картинка (приведена показательная часть, где отмечены взаимодействия с белком):
Наибольшее число контактов: G1002, A1003, T1004, G1005, T1017.
Белок "охватывает" С-цепь ДНК, ближе к 5'-концу. Демонстрация:
Все данные подтверждают, что белок присоединяется к последовательности 5'-GATGCGGG-3'.
Специфичная связь - только с атомами большой бороздки оснований G1008, G1009, C1018.
Значит, распознающими могут являться контакты именно с этими нуклеотидами.
Белок: GCM1_MOUSE (P70348)
Длина: 436 ак
Домен: GCM transcription factors
Информация:
GCM транскрипцонные факторы вовлечены в фундаментальные процессы развития
организма. Их ДНК-связывающий домен расположен на N-конце, содержит 150 ак.
C-конец мало консервативен.
ДНК-связывающий домен присоединяется к неполиндромному октамеру 5'-ATGCGGGT-3'.
Консервативные остатки: семь цистеинов, четыре гистидина. Лиганды: два цинка.
Домен состоит из большего (пять бета-листов) и меньшего (три бета-листа) субдоменов;
имеется три небольших спиральных элемента, протиопоставленных бета-листам.
Картинка: