Учебный сайт Кирилла Цуканова → Третий семестр

A- и В- формы ДНК. Структура РНК

Задание 1 (подготовить структуры)

С помощью fiber из пакета 3DNA получим три файла: gatc-a.pdb, gatc-b.pdb и gc-z.pdb (программа не умеет выдавать структуру произвольной последовательности в Z-форме).

Задание 2 (средства RasMol для работы со структурами)

Упражнение 1. Для выделения групп атомов был составлен скрипт:

rotate x 90
restrict none
# «все нуклеотиды» — это, фактически, вся наша структура
select nucleic
wireframe
# сахарофосфатный остов
select backbone
spacefill 80
# все аденины (основание+сахар+фосфат)
select a
colour green
# атом N7 во всех гуанинах
select G*.N7
spacefill 150
# атом N7 в первом гуанине в каждой цепи
select G1:A.N7, G21:B.N7
label %n%r:%c.%a
colour label white

На иллюстрациях все нуклеотиды (т. е. вся модель) изображена в wireframe, сахарофосфатный остов дополнительно имеет spacefill 80, все аденины покрашены в зеленый цвет, атом N7 во всех гуанинах имеет spacefill 150, а соответствующие атомы в первом гуанине в каждой цепи подписаны.

Упражнения 2 и 3. PDB-структуры, выданные для анализа: 1U0B.pdb, 1BDT.pdb.

Разрывов с структурах не обнаружилось. Первая содержит комплекс РНК-белок, вторая — ДНК-белок. Отдельно сохраненные нуклеиновые кислоты (1U0B_nucleic.pdb, 1BDT_nucleic.pdb) выглядят так:

Задание 3 (сравнение структур)

Упражнение 1. По отношению к большой и малой бороздкам аденин расположен так:

Раскраска структурной формулы основания (был выбран A10) по ориентации атомов:

Красные атомы (это N6, C6, C5, N7 и С8 — в PDB-файле они пронумерованы, как и положено по номенклатуре) смотрят в сторону большой бороздки, синие (N1, C2, N3) — в сторону малой. Оставшиеся два атома расположены посередине, приблизительно между двумя бороздками.

В A-форме ориентация атомов аденина у меня получилась точно такая же. Однако интересно отметить, что в A-форме ДНК более глубокая бороздка (которая и является большой) заметно уже второй, которая тем не менее будет являться малой. В имеющейся структуре Z-формы нет аденинов, но только N2-атомы гуанинов и O2-атомы цитозина «смотрят» в сторону большой (более глубокой, но также более узкой) бороздки, основание же в целом направлено в сторону малой бороздки.

Упражнение 2. Параметры спирали:

A B Z
Закрученность правая правая левая
Шаг спирали, Å 28.05 33.80 43.56
Оснований на виток 11 10 12
Ширина большой бороздки 7.98 17.21 7.20
Ширина малой бороздки 16.61 11.69 17.60

Для всех трех форм ширина бороздок измерена от фосфата гуанина.

При выполнении этого задания я еще раз убедился, что глаза меня не обманывают — большая бороздка в А-форме действительно вдвое уже, чем большая, зато глубже ее раз в восемь. Я бы сказал, это не бороздка, это какой-то Гранд Каньон. Нет, ну правда:

В случае с Z-формой то же самое, хотя каньон уже не такой большой:

Задача измерения ширины большой бороздки в Z-форме оказалась не такой уж простой (сложность вызвал выбор подходящего атома фосфора из комплементарной цепи, чтобы получившаяся величина адекватно отражала ширину бороздки). В итоге я решил взять атомы так, чтобы линия, их соединяющая, проходила приблизительно перпендикулярно направлению движения бороздки.

UPD: после выполнения четвертого задания я решил сравнить то, что насчитал сам, с данными программы analyze из пакета 3DNA, а именно — ширину и правильность определения большой и малой бороздок. В вышеприведенном тексте я решил ничего уже не менять, из принципа исторической справедливости, а вот дополнение написать себя считаю обязанным.

Для B-формы общеизвестно, что широкая бороздка — это большая, а узкая — малая. Против моих 17.21/11.69 (по гуанину) у analyze 17.2/11.7. Прекрасно.

В A-форме узкая бороздка явно намно-о-о-го глубже (если я правильно понимаю этот термин), чем широкая, поэтому узкую и глубокую следует признать большой, а ту, где сгрудились все основания — малой, хотя интуиция и подсказывает обратное. У меня вышло 7.98/16.61, а у analyze 11.1/16.7. Тоже неплохо, и, получается, все-таки я был прав по поводу распределения названий бороздок.

С Z-формой всё сложнее. Если применять ту же логику, что и для A-формы, то узкая дорожка там по-прежнему заметно глубже широкой, и поэтому я опять-таки признал ее за большую, а широкую — за малую. Однако analyze против моих 7.20/17.60 (ширина бороздок заметно отличается и на глаз!) насчитал (14.7—20.2)/9.8, то есть, хотя с измерениями в целом я не ошибся, все-таки в Z-форме analyze считает широкую, но явно менее глубокую бороздку большой, а узкую — малой. Загадочная головоломка, очень загадочная.

Упражнение 3. Торсионные углы (для аденина), посчитанные вручную.

α (P–O5') β (O5'–C5') γ (C5'–C4') δ (C4'–C3') ε (C3'–O3') ζ (O3'–P) χ (O4'–C1'–N9–C4)
A-ДНК −51.70 174.79 41.72 79.06 −147.80 −75.06 −157.23
B-ДНК −29.87 136.38 31.10 143.42 −140.77 −160.62 −97.99

Как можно легко заметить, с данными, приведенными в презентации, все это согласуется весьма плохо. Почему — я понятия не имею. Может, потому, что у нас структура не настоящая, а модельная в вакууме (буквально выражаясь). Наверное, если поместить это в раствор, в реальном окружении торсионные углы поменяются.

Задание 4 (3DNA)

Все пять файлов (gatc-a, gatc-b, gc-z, 1BDT, 1U0B) были сконвертированы в старый формат программой remediator и для каждой из них запущена команда find_pair -t $f stdout | analyze. Для структуры 1BDT (ДНК) команда не выдала результат, поскольку терминальные остатки тимина были названы DT (вместо T, см. иллюстрацию ниже), которые программа find_pair не смогла распознать. После замены вручную всё отработало штатно.

Упражнение 1: торсионные углы нуклеотидов.

α β γ δ ε ζ χ
gatc-a −51.7 174.8 41.7 79.1 −147.8 −75.1 −157.2
gatc-b −29.9 136.4 31.1 143.4 −140.8 −160.5 −98.0
gc-z, G 52.0 179.0 −173.8 94.9 −103.6 −64.8 58.7
gc-z, C −139.5 −136.8 50.8 137.6 −96.5 82.0 −154.3
1U0B, тРНК −75 ±170 50 80 −150 −70 −170
1BDT, ДНК −40.0 36.8 27.0 137.6 −79.0 −79.9 −110.3
1BDT, A5 168.8 172.0 172.5 139.5 −155.0 −96.5 −144.3

(Для первых четырех структур указан один из результатов — они одинаковые для каждого остатка; для тРНК указана визуальная оценка среднего значения параметра, для ДНК — среднее арифметическое всех значений, кроме краевых нуклеотидов.)

Среди первых четырех структур больше всего отличаются... все углы. Серьезно, разные формы так колбасит, что нормально ответить на этот вопрос невозможно. Особенно отличилась Z-форма, которая, по крайней мере в том варианте, который выдал нам fiber, имеет абсолютно непохожие параметры для разных нуклеотидов. Меньше всего отличаются углы δ и ε — они хотя бы знак сохраняют, и на том спасибо.

Невооруженным глазом видно, что больше тРНК похожа на A-ДНК.

В ДНК по результатам забега с участием среднеквадратического отклонения с отрывом победил победил A5 (в обозначении PDB-файла), торсионные углы которого указаны в таблице выше.

Упражнение 2: структура водородных связей в тРНК.

Из файла результатов видно, что стебли образуют участки: 1–7/72–66; 26–44 (с петлей на конце и выпячиванием в виде одного-единственного основания 37); 49–53/65–61; 10–12/25–23. Из 23 пар, входящих в состав стеблей, 21 является канонической, а две — U43—G27 и C44—A26 в антикодоновом стебле — неканоническими (показаны красным). В структуре также есть несколько пар, которые соединяют разные стебли. Всего таких дополнительных связей, укрепляющих трехмерную структуру РНК, восемь. Две из них канонические (U54—A58, G19—C56, показаны оранжевым) и еще шесть — неканонические: U55—G18, A13—A9, A14—A46, G15—G48, C16—C59, U73—C74, показаны зеленым.

Упражнение 3: стекинг-взаимодействия.

Наибольшая сумма перекрывания (14.11) оказалась у пар G27—U43/G42—C28, номер секции 0020. Картинка их перекрывания выглядит так:

Наименьшая ненулевая сумма перекрывания (0.59) у пар G27—U43/C44—A26, номер секции 0021. (Т. е. пара G27—U43 с одним соседом образует наибольшее перекрывание, а с другим — наименьшее.) Их перекрывание выглядит так:

Это даже и перекрыванием назвать сложно.

Теперь посмотрим, как эти три пары расположены в тРНК. Видно, что они находятся в основании антикодонового стебля. Это явно очень важное место, что было заметно уже по картинке из предыдущего упражнения.