Задание 1 (подготовить структуры)
С помощью fiber
из пакета 3DNA получим три файла: gatc-a.pdb, gatc-b.pdb и gc-z.pdb (программа не умеет выдавать структуру произвольной последовательности в Z-форме).
Задание 2 (средства RasMol для работы со структурами)
Упражнение 1. Для выделения групп атомов был составлен скрипт:
rotate x 90 restrict none # «все нуклеотиды» — это, фактически, вся наша структура select nucleic wireframe # сахарофосфатный остов select backbone spacefill 80 # все аденины (основание+сахар+фосфат) select a colour green # атом N7 во всех гуанинах select G*.N7 spacefill 150 # атом N7 в первом гуанине в каждой цепи select G1:A.N7, G21:B.N7 label %n%r:%c.%a colour label white
На иллюстрациях все нуклеотиды (т. е. вся модель) изображена в wireframe, сахарофосфатный остов дополнительно имеет spacefill 80, все аденины покрашены в зеленый цвет, атом N7 во всех гуанинах имеет spacefill 150, а соответствующие атомы в первом гуанине в каждой цепи подписаны.
Упражнения 2 и 3. PDB-структуры, выданные для анализа: 1U0B.pdb, 1BDT.pdb.
Разрывов с структурах не обнаружилось. Первая содержит комплекс РНК-белок, вторая — ДНК-белок. Отдельно сохраненные нуклеиновые кислоты (1U0B_nucleic.pdb, 1BDT_nucleic.pdb) выглядят так:
Задание 3 (сравнение структур)
Упражнение 1. По отношению к большой и малой бороздкам аденин расположен так:
Раскраска структурной формулы основания (был выбран A10) по ориентации атомов:
Красные атомы (это N6, C6, C5, N7 и С8 — в PDB-файле они пронумерованы, как и положено по номенклатуре) смотрят в сторону большой бороздки, синие (N1, C2, N3) — в сторону малой. Оставшиеся два атома расположены посередине, приблизительно между двумя бороздками.
В A-форме ориентация атомов аденина у меня получилась точно такая же. Однако интересно отметить, что в A-форме ДНК более глубокая бороздка (которая и является большой) заметно уже второй, которая тем не менее будет являться малой. В имеющейся структуре Z-формы нет аденинов, но только N2-атомы гуанинов и O2-атомы цитозина «смотрят» в сторону большой (более глубокой, но также более узкой) бороздки, основание же в целом направлено в сторону малой бороздки.
Упражнение 2. Параметры спирали:
A | B | Z | |
Закрученность | правая | правая | левая |
Шаг спирали, Å | 28.05 | 33.80 | 43.56 |
Оснований на виток | 11 | 10 | 12 |
Ширина большой бороздки | 7.98 | 17.21 | 7.20 |
Ширина малой бороздки | 16.61 | 11.69 | 17.60 |
Для всех трех форм ширина бороздок измерена от фосфата гуанина.
При выполнении этого задания я еще раз убедился, что глаза меня не обманывают — большая бороздка в А-форме действительно вдвое уже, чем большая, зато глубже ее раз в восемь. Я бы сказал, это не бороздка, это какой-то Гранд Каньон. Нет, ну правда:
В случае с Z-формой то же самое, хотя каньон уже не такой большой:
Задача измерения ширины большой бороздки в Z-форме оказалась не такой уж простой (сложность вызвал выбор подходящего атома фосфора из комплементарной цепи, чтобы получившаяся величина адекватно отражала ширину бороздки). В итоге я решил взять атомы так, чтобы линия, их соединяющая, проходила приблизительно перпендикулярно направлению движения бороздки.
UPD: после выполнения четвертого задания я решил сравнить то, что насчитал сам, с данными программы analyze из пакета 3DNA, а именно — ширину и правильность определения большой и малой бороздок. В вышеприведенном тексте я решил ничего уже не менять, из принципа исторической справедливости, а вот дополнение написать себя считаю обязанным.
Для B-формы общеизвестно, что широкая бороздка — это большая, а узкая — малая. Против моих 17.21/11.69 (по гуанину) у analyze 17.2/11.7. Прекрасно.
В A-форме узкая бороздка явно намно-о-о-го глубже (если я правильно понимаю этот термин), чем широкая, поэтому узкую и глубокую следует признать большой, а ту, где сгрудились все основания — малой, хотя интуиция и подсказывает обратное. У меня вышло 7.98/16.61, а у analyze 11.1/16.7. Тоже неплохо, и, получается, все-таки я был прав по поводу распределения названий бороздок.
С Z-формой всё сложнее. Если применять ту же логику, что и для A-формы, то узкая дорожка там по-прежнему заметно глубже широкой, и поэтому я опять-таки признал ее за большую, а широкую — за малую. Однако analyze против моих 7.20/17.60 (ширина бороздок заметно отличается и на глаз!) насчитал
Упражнение 3. Торсионные углы (для аденина), посчитанные вручную.
α (P–O5') | β (O5'–C5') | γ (C5'–C4') | δ (C4'–C3') | ε (C3'–O3') | ζ (O3'–P) | χ (O4'–C1'–N9–C4) | |
A-ДНК | −51.70 | 174.79 | 41.72 | 79.06 | −147.80 | −75.06 | −157.23 |
B-ДНК | −29.87 | 136.38 | 31.10 | 143.42 | −140.77 | −160.62 | −97.99 |
Как можно легко заметить, с данными, приведенными в презентации, все это согласуется весьма плохо. Почему — я понятия не имею. Может, потому, что у нас структура не настоящая, а модельная в вакууме (буквально выражаясь). Наверное, если поместить это в раствор, в реальном окружении торсионные углы поменяются.
Задание 4 (3DNA)
Все пять файлов (gatc-a, gatc-b, gc-z, 1BDT, 1U0B) были сконвертированы в старый формат программой remediator
и для каждой из них запущена команда find_pair -t $f stdout | analyze
Упражнение 1: торсионные углы нуклеотидов.
α | β | γ | δ | ε | ζ | χ | |
gatc-a | −51.7 | 174.8 | 41.7 | 79.1 | −147.8 | −75.1 | −157.2 |
gatc-b | −29.9 | 136.4 | 31.1 | 143.4 | −140.8 | −160.5 | −98.0 |
gc-z, G | 52.0 | 179.0 | −173.8 | 94.9 | −103.6 | −64.8 | 58.7 |
gc-z, C | −139.5 | −136.8 | 50.8 | 137.6 | −96.5 | 82.0 | −154.3 |
1U0B, тРНК | −75 | ±170 | 50 | 80 | −150 | −70 | −170 |
1BDT, ДНК | −40.0 | 36.8 | 27.0 | 137.6 | −79.0 | −79.9 | −110.3 |
1BDT, A5 | 168.8 | 172.0 | 172.5 | 139.5 | −155.0 | −96.5 | −144.3 |
(Для первых четырех структур указан один из результатов — они одинаковые для каждого остатка; для тРНК указана визуальная оценка среднего значения параметра, для ДНК — среднее арифметическое всех значений, кроме краевых нуклеотидов.)
Среди первых четырех структур больше всего отличаются... все углы. Серьезно, разные формы так колбасит, что нормально ответить на этот вопрос невозможно. Особенно отличилась Z-форма, которая, по крайней мере в том варианте, который выдал нам fiber, имеет абсолютно непохожие параметры для разных нуклеотидов. Меньше всего отличаются углы δ и ε — они хотя бы знак сохраняют, и на том спасибо.
Невооруженным глазом видно, что больше тРНК похожа на A-ДНК.
В ДНК по результатам забега с участием среднеквадратического отклонения с отрывом победил победил A5 (в обозначении PDB-файла), торсионные углы которого указаны в таблице выше.
Упражнение 2: структура водородных связей в тРНК.
Из файла результатов видно, что стебли образуют участки: 1–7/72–66; 26–44 (с петлей на конце и выпячиванием в виде одного-единственного основания 37); 49–53/65–61; 10–12/25–23. Из 23 пар, входящих в состав стеблей, 21 является канонической, а две — U43—G27 и C44—A26 в антикодоновом стебле — неканоническими (показаны красным). В структуре также есть несколько пар, которые соединяют разные стебли. Всего таких дополнительных связей, укрепляющих трехмерную структуру РНК, восемь. Две из них канонические (U54—A58, G19—C56, показаны оранжевым) и еще шесть — неканонические: U55—G18, A13—A9, A14—A46, G15—G48, C16—C59, U73—C74, показаны зеленым.
Упражнение 3: стекинг-взаимодействия.
Наибольшая сумма перекрывания (14.11) оказалась у пар G27—U43/G42—C28, номер секции 0020. Картинка их перекрывания выглядит так:
Наименьшая ненулевая сумма перекрывания (0.59) у пар G27—U43/C44—A26, номер секции 0021. (Т. е. пара G27—U43 с одним соседом образует наибольшее перекрывание, а с другим — наименьшее.) Их перекрывание выглядит так:
Это даже и перекрыванием назвать сложно.
Теперь посмотрим, как эти три пары расположены в тРНК. Видно, что они находятся в основании антикодонового стебля. Это явно очень важное место, что было заметно уже по картинке из предыдущего упражнения.