Практикум 3. Предсказание вторичной структуры тРНК, комплексы ДНК-белок
В этом практикуме была предсказана структура заданной тРНК с помощью поиска инвертированных повторов, а также по алгоритму Зукера. Кроме того, в заданном комплексе ДНК-белок были найдены межмолекулярные контакты.
Сравнение предсказаний вторичной структуры тРНК с помощью программ einverted и RNAFold
Для изучения была выбрана тРНК (PDB ID: 1H4S) из прошлого практикума.
Также для сравнения приведена выдача программы find_pair из прошлого практикума.
Программа einverted предназначена для нахождения инвертированных повторов в заданной последовательности нуклеотидов, а потому может быть использована как средство поиска стеблей во вторичной структуре тРНК. К сожалению, такой поиск осложнён тем, что в структуре тРНК присутствуют неканонически взаимодействующие пары нуклеотидов, а сами стебли представляют собой не слишком длинные комплементарные участки. В результате einverted при параметрах по умолчанию (gap penalty [12], minimum score threshold [50], match score [3], mismatch score [-4]) не выдаёт ничего. После множества проб и ошибок, в ходе которых программа выдавала либо длинное выравнивание с большим количеством гэпов, не имеющее ничего общего с реальной структурой, либо одно короткое, было решено остановится на варианте, приведённом далее (gap penalty [12], minimum score threshold [0], match score [3], mismatch score [-6]).
: Score 21: 7/7 (100%) matches, 0 gaps 1 cggggag 7....... ||||||| 73 gcccctc 67......
На первый взгляд, в полученном результате нет ничего общего с результатом работы find_pair, однако, как оказалось, по неустановлееной причине нумерация нуклеотидов в конце последовательности в fasta-файле сдвинута на 1 относительно таковой в pdb-файле.
Программа RNAFold реализует алгоритм Зукера для предсказания вторичной структуры РНК. Результат её применения к последовательности исследуемой тРНК доступен по ссылке. Затем при помощи утилиты ps2pdf этот файл был представлен в виде изображения, с которым можно ознакомиться на рисунке 1.

В таблице 1 представлены результаты сравнения предсказаний вторичной структуры тРНК, полученные с помощью разных программ.
Участок структуры | Позиции в структуре (по результатам find_pair) | Результаты предсказания с помощью einverted | Результаты предсказания по алгоритму Зукера |
---|---|---|---|
Акцепторный стебель | 5' 4 - 69 3' ... 5' 7 - 66 3' (4 пары) |
Предсказано 7 пар из 7 реальных | Предсказано 7 пар из 7 реальных |
D-стебель | 5' 10 - 25 3' ... 5' 13 - 22 3' (4 пары) |
Предсказано 0 пар из 4 реальных | Предсказано 4 пары из 4 реальных |
T-стебель | 5' 49 - 65 3' ... 5' 53 - 61 3' (5 пар) |
Предсказано 0 пар из 4 реальных | Предсказано 5 пар из 4 реальных |
Антикодоновый стебель | 5' 26 - 44 3' ... 5' 32 - 38 3' (7 пар) |
Предсказано 0 пар из 5 реальных | Предсказано 7 пар из 5 реальных |
Общее число канонических пар нуклеотидов | 18 | 7 | 21 |
Поиск ДНК-белковых контактов
Для этой цели был выбран комплекс MH1-домена белка SMAD с ДНК (PDB ID: 1MHD), при этом рассматривались взаимодействия двухцепочечной молекулы ДНК с A-цепью молекулы белка.
Далее был написан JMol-скрипт, определяющий следующие множества атомов: полярные и неполярные атомы белка, остатков дезоксирибозы, остатков фосфорной кислоты, остатков азотистых оснований (обращённые в сторону большой и малой бороздок), а также (в частности) атомы кислорода в остатках дезоксирибозы и фосфорной кислоты и атомы азота в остатках оснований. Ознакомиться со скриптом можно здесь.
Ниже во встроенном JSMol-апплете демонстрируется объект изучения и некоторые возможности вышеупомянутого скрипта для определения групп атомов (для переключения на следующий режим просмотра воспользуйтесь кнопкой [Next]). Просмотреть версию демонстрационного скрипта для JMol можно по ссылке.
Затем был проведён собственно поиск ДНК-белковых взаимодействий. Для этого также был написан скрипт, доступный
здесь. Взаимодействующими считались:
1) "полярные" (азот, кислород) атомы ДНК и белка, расположенные на расстоянии не более 3.5 Å;
2) "неполярные" (углерод, фосфор, сера) атомы ДНК и белка, расположенные на расстоянии не более 4.5 Å.
Результаты поиска приведены в таблице 2.
Контакты атомов белка с: | Полярные | Неполярные | Всего |
---|---|---|---|
Остатками 2'-дезоксирибозы | 1 | 4 | 5 |
Остатками фосфорной кислоты | 5 | 1 | 6 |
Остатками азотистых оснований со стороны большой бороздки | 4 | 10 | 14 |
Остатками азотистых оснований со стороны малой бороздки | 0 | 0 | 0 |
Заметно, что среди контактов белка с остатками сахара преобладают неполярные; это можно объяснить тем, что в остатке дезоксирибозы попросту больше углерода, чем кислорода. Аналогично объясняются и преимущественно полярные взаимодействия фосфатных остатков; к тому же, в этом случае "полярные" атомы кислорода расположены как бы наружу по отношению к остову цепи, заслоняя собой атомы фосфора, что способствует взаимодействию белка именно с ними. Относительно большое количество неполярных взаимодействий белка с атомами, обращёнными к большой бороздке, вероятно, связано с тем, что мы принимали неполярные контакты как более "дальнодействующие" (4.5 Å против 3.5 Å для полярных), в результате чего образовывались группы взаимодействующих атомов, каждая пара из которых считалась за контакт. К тому же молекула данного белка достаточно компактна и связывается с ДНК практически исключительно по большой бороздке; это также приводит к отсутствию контактов белка с атомами малой бороздки.
Для того, чтобы представить взаимодействия ДНК с белком на схеме, была использована программа nucplot (требовалось предварительно перевести pdb-файл со структурой в старый формат при помощи remediator). Результат представлен на рисунках 2.1 и 2.2.


Среди аминокислотных остатков, которые, согласно схеме, взаимодействуют с ДНК, были выбраны Leu71(A) (как один из остатков с наибольшим числом взаимодействий - 2) и Arg74(A) (как, предположительно, самый важный для определения последовательности ДНК). Выбор Arg74(A) обусловлен тем, что этот остаток, по-видимому, образует две водородные связи с Gua2004(D) (доноры водорода - атомы NH1 и NH2 остатка аргинина, акцепторы водорода - атомы N7 и O6 остатка дезоксигуанозинфосфата), а значит, это позволяет белку относительно надёжно и специфично узнавать определённое азотистое основание (гуанин), что может играть значительную роль в распознавании последовательности. Иллюстрации взаимодействия выбранных аминокислотных остатков с молекулой ДНК приведены на рисунках 3 и 4.

