Комплексы ДНК-белок


Задание 1. Предсказание вторичной структуры заданной тРНК
Упр.1. Предсказание вторичной структуры тРНК путем поиска инвертированных повторов
Программа einverted из пакета EMBOSS позволяет найти инвертированные участки в нуклеотидных последовательностях. Einverted получает на вход нуклеотидную последовательность и выдает sequence_pr13.fasta и sequence.inv файлы, содержащие информацию об обнаруженных комплементарных участках последовательности и предполагаемых водородных связях на этих участках соответственно.
Запуск программы с парамерами по умолчанию оказался неудачным: файлs оказались пустыми. Посему пришлось подбирать оптимальные параметры. Параметры, при которых результаты максимально отражали реальность, представлены на рисунке 1. Тем не менее, программе удалось предсказать только 6 пар, причем неканонические взаимодействия она не опеределяет. В общем, find_pair справилась с задачей гораздо лучше.

Рис. 1 Оптимальные параметры для einverted

Упр.2. Предсказание вторичной структуры тРНК по алгоритму Зукера
На этом этапе использовалась программа RNAfold из пакета Viena Rna Package, основанная на алгоритме Зукера. Она принимает на вход последовательность РНК и расчитывает ее вторичную структуру с минимальной свободной энергией.
Командой cat 1gtr.fasta | RNAfold --MEA >> rna_fold.fasta был получен файл rna_fold.fasta, где первая строчка - последовательность РНК, а последующие - предсказанная структура.
Полученные результаты трактовать заметно сложнее, чем в случае использования предыдущей программы. Используются обозначения: точки - нуклеотиды, не образующие водородные связи, круглые скобки - спаренные нуклеотиды, квадратные и фигурные скобки - взаимодействия, образующие псевдоузлы. Из также выданного файла 1GTR:B|PDBID|CHAIN|SEQUENCE_ss.ps были получены номера спаренных нуклеотидов: [1 69], [2 68], [3 67], [5 65], [6 64], [9 23], [10 22], [11 21],
[25 41], [26 40], [27 39], [28 38], [29 37], [47 63], [48 62], [49 61], [50 60], [51 59].

На рисунке 2 представлена предсказанная вторичная структура, полученная из этого же файла, на рисунке 3 - матрица для предсказанной вторичной структуры.

Рис. 2 Предсказанная структуры тРНК с помощью RnaFold Рис. 3 Матрица для предсказанной вторичной структуры

В общем, программа RNAfold неплохо справляется с поставленной задачей. В таблице №2 представлено сравнение работы 3-х программ.

Таблица №2
Сравнение реальной и предсказанной вторичной стуктуры тРНК
Позиции в стуктуре (по результатам find_pair) Результаты предсказания с помощью einverted Результаты предсказания по алгоритму Зукера
Акцепторный стебель 2-7, 66-71 (всего 6) 1-6, 64-69 (всего 6; абсолютно соответсвует, но почему-то сбита нумерация) 1-6, 64-69 (всего 6)
Т-стебель 49-53, 61-65 (всего 5) 0 47-51, 59-63 (всего 5)
Антикодоновый стебель 37-44, 26-33 (всего 8) 0 25-29, 37-41 (всего 5)
D-стебель 10-12, 23-25 (всего 3) 0 9-11, 21-22 (всего 3)
Всего 22 6 19

Из таблицы видно, что программа einverted плоха для определения вторичной структуры РНК, в то время как RNAfold обнаруживает все четыре стебля и почти верно определяет число взаимодействующих нуклеотидов для каждого из них.


Задание 2. Поиск ДНК-белковых контактов в заданной структуре
Упр. 1
Скрипт определяет множество атомов кислорода 2'-дезоксирибозы (set1), множество атомов кислорода в остатке фосфорной кислоты (set2), множество атомов азота в азотистых основаниях (set3) и дает последовательное изображение всей структуры, только ДНК в проволочной модели, той же модели, но с выделенными шариками множеством атомов set1, затем set2 и set3.

Упр. 2
Далее требуется описать ДНК-белковые контакты в структуре с PDB ID 1rh6 и сравнить количество контактов разной природы.
Будем считать полярными атомы кислорода и азота, а неполярными – атомы углерода, фосфора и серы. Назовем полярным контактом ситуацию, в которой расстояние между полярным атомом белка и полярным атомом ДНК меньше 3.5 Å. Аналогично, неполярным контактом будем считать пару неполярных атомов на расстоянии меньше 4.5 Å. Результаты представлены в таблице №3.

Таблица №3
Контакты разного типа в комплексе 1rh6.pdb
Контакты атомов белка с Полярные Неполярные Всего
остатками 2'-дезоксирибозы 4 22 26
остатками фосфорной кислоты 11 17 28
остатками азотистых оснований со стороны большой бороздки 3 5 8
остатками азотистых оснований со стороны малой бороздки 1 0 1

Видно, что большинство контактов образуются с участием фосфорной кислоты. На втором месте - с остатками 2'-дезоксирибозы. Также можно отметить, что взаимодействий с остатками оснований большой бороздки контактов значительно больше, чем с остатками оснований со стороны малой. Это обуславливается большей пространственной доступностью атомов большой бороздки.

Упр.3
Здесь требуется получить популярную схему ДНК-белковых контактов с помощью программы nucplot. Чтобы перевести файл в старый формат bdp, необходимый для работы програмыы, была использована команда remediator --old 1rh6.pdb >> 1rh6_old.pdb. Затем, командой nucplot 1rh6_old.pdb был получен рис. 4 (из файла nucplot.ps). Программа нашла не только определенные нами контакты, но и различные другие.

Рис. 4 Популярная схема ДНК-белковых контактов

Данный белок образует не очень много контактов с ДНК. Большинство контактов образует Arg23, а именно 2 контакта, с цепью C. Этот же остаток аминокислоты будет наиболее важным для распознавания последовательности ДНК, поскольку именно у него самое большое количество связей с азотистыми основаниями.
С помощью JMol было создано изображение взаимодействий Arg23 с ДНК (рис. 5).

Рис. 5 Контакт Arg23 с G5 и T6