Предсказание вторичной структуры заданной тРНК

В этом задании необходимо было сравнить реальную и предсказанные вторичные структуры заданной тРНК (PDB ID 1I9V), полученные с помощью find_pair (реальная структура) и двух методов предсказания - путем поиска инвертированных повторов и по алгоритму Зукера. Схематическое изображение участков вторичной структуры показано на рисунке 2 [1].

Поиск инвертированных повторов проводился с помощью программы einverted из пакета EMBOSS, которая получает на вход последовательность нуклеотидов, а на выходе дает файлы sequence.fasta и sequence.inv, содержащие информацию об обнаруженных комплементарных участках последовательности и предполагаемых водородных связях на этих участках соответственно.

Когда я использовала программу с параметрами по умолчанию, файл sequence.fasta оказывался пустым, поэтому для корректной работы пришлось подбирать параметры вручную. Наиболее значимые изменения вызывало варьирование параметра Minimum score threshold, который по умолчанию был равен 50. Программа начинала выдавать результат при понижении threshold до 16, однако наиболее близкие к реальной структуре предсказания были получены при threshold 14 и ниже. Наилучший результат, которого мне удалось добиться с помощью этой программы - полное предсказание для одного из стеблей и частичное, с несовпадением конца и начала, для другого.

Далее была использована программа RNAfold из пакета Viena Rna Package, которая реализует алгоритм Зукера. RNAfold принимает на вход последовательность РНК и рассчитывает вторичную структуру РНК с минимальной свободной энергией (mfe) в формате DBN (Dot-Bracket Notation). Точки обозначают неспаренные нуклеотиды, круглые скобки - спаренные. Квадратные и фигурные скобки обозначают взаимодействия, формирующие псевдоузлы.

Для моей структуры RNAfold сработала достаточно хорошо, причем с первого раза. Были абсолютно правильно предсказаны 3 из 4 стеблей и один из стеблей был предсказан со сдвигом на один нуклеотид.

Реальная и предсказанная вторичные структуры тРНК из файла 1i9v.pdb
Участок структурыПозиции в структуре (результаты find_pair) Результаты предсказания с помощью einverted Результаты предсказания по алгоритму Зукера
Акцепторный стебель5'-1-7-3'
5'-66-72-3'
всего 7 пар
предсказано 0 пар из 7 реальныхпредсказано 7 пар из 7 реальных, стебель предсказан полностью
D-стебель5'-10-13-3'
5'-22-25-3'
всего 4 пары
предсказано 0 пар из 4 реальныхпредсказано 4 пары из 4 реальных, стебель предсказан полностью
T-стебель5'-49-53-3'
5'-61-65-3'
всего 5 пар
предсказано 5 пар из 5 реальных, стебель предсказан полностью, начало и конец совпадают предсказано 4 пары из 5 реальных + одна лишняя пара, начало и конец стебля не совпадают
Антикодоновый стебель5'-40-44-3'
5'-26-30-3'
всего 5 пар
предсказано 5 пар из 5 реальных, но начала и концы стеблей в реальной и предсказанной структурах не совпадают, предсказано 5 лишних парпредсказано 5 пар из 5 реальных, стебель предсказан полностью
Общее число канонических пар нуклеотидов231323

Точечный график, показывающий вероятность образования пар оснований, RNAfold Предсказанная вторичная структура тРНК с минимальной свободной энергией, RNAfold

Поиск ДНК-белковых контактов в структуре PDB ID: 1MDM

В упражнении 1 было необходимо задать множества атомов кислорода 2'-дезоксирибозы (set1), атомов кислорода в остатке фосфорной кислоты (set2) и атомов азота в азотистых основаниях (set3) с помощью команды define, а затем создать скрипт, последовательно отображающий изображения всего ДНК-белкового комплекса, только ДНК в проволочной модели и той же модели, но с выделенными шариками множествами атомов set1, set2 и set3. Результаты работы представлены в скрипте.

При нажатии на окно апплета скрипт запустится автоматически. Для продолжения работы скрипта после паузы используйте кнопку resume.

В следующем задании было необходимо найти ДНК-белковые контакты в заданной структуре (PDB ID: 1MDM) и сравнить количество контактов разной природы. Полярными считались атомы кислорода и азота, а неполярными - атомы углерода, фосфора и серы. Под полярным контактом понималась ситуация, когда расстояние между полярным атомом белка и полярным атомом ДНК меньше 3.5Å. Аналогично, под неполярным контактом подразумевалась пара неполярных атомов на расстоянии меньше 4.5Å.

Текст скрипта



Результаты работы представлены в таблице.
Контакты атомов белка с: ПолярныеНеполярныеВсего
остатками 2'-дезоксирибозы75158
остатками фосфорной кислоты171633
остатками азотистых оснований со стороны большой бороздки31619
остатками азотистых оснований со стороны малой бороздки4913


Cхема ДНК-белковых контактов в комплексе 1MDM
Как видно из таблицы, наибольшее количество контактов в заданном комплексе реализуется между белком и остатками 2'-дезоксирибозы, контактов с остатками фосфорной кислоты тоже достаточно много. Наименьшее число контактов - между белком и остатками азотистых оснований со стороны малой бороздки. Таким образом, можно предположить, что белок наиболее охотно контактирует с остовом ДНК, и менне охотно - с остатками азотистых оснований. Вероятнее всего, это объясняется пространственным расположением соответсвующих участков в спирали. Также можно отметить, что в заданном комплексе неполярных контактов во всех случаях больше, чем полярных.

Далее было необходимо получить популярную схему ДНК-белковых контактов в комплексе 1MDM с помощью программы nucplot. Так как она не работает с новыми pdb, для начала нужно было воспользоваться программой remediator, чтобы получить файл в старом pdb-формате.
Посредством команды nucplot 1CF7_old.pdb был получен файл nucplot.ps, который затем был конвертирован в изображение.

Аминокислотные остатки с наибольшим числом указанных на схеме контактов с ДНК - Asn21(A) (2 контакта с одним остатком фосфорной кислоты и 1 с другим) и Arg137(A) (3 контакта с одним остатком фосфорной кислоты).

На мой взгляд, для распознавания последовательности ДНК наиболее важны аминокислотные остатки, контактирующие с остатками азотистых оснований, а не с остовом, так как именно они могут обеспечить специфичное связывание и помочь в определении последовательности. Соответсвенно, в моем комплексе наиболее важными я посчитала аминокислотные остатки, образующие наибольшее число таких контактов - Gly84(A) и Gly30(A) (см. page 2). Каждый из них образует по 2 контакта с комплементарными C и G.

C помощью JMol были получены изображения, иллюстрирующие контакты выбранных аминокислотных остатков с ДНК. Контактирующие аминокислотные остатки и остатки азотистых оснований изображены в виде wireframe c раскраской cpk.


Аминокислотные остатки с
наибольшим числом контактов
с ДНК в комплексе 1MDM
Контакт Asn21(A) с остатками фосфорной
кислоты [DC]16:D и [DA]17:D
Контакт Arg137(A) с остатками фосфорной
кислоты [DT]21:C

Аминокислотные остатки, наиболее важные для распознавания последовательности ДНК в комплексе 1MDM
Контакт Gly30(A) c остаками азотистых оснований [DG]13:D и [DC]15:C Контакт Gly84(A) c остаками азотистых оснований [DG]11:D и [DC]17:C

Источники