Комплексы ДНК-белок

Задание 1

Упражнение 1

Результаты предсказания с параметрами Gap penalty 0 (в структуре должны быть петли, странно начислять за них штрафы) и Minimum score treshold 0 представлены на изображении. Более высокие значения обоих параметров приводили к тому, что в выдаче находились только 7 пар акцепторного стебля и больше ничего, (я решила, что выдача при таких параметрах похожа на реальную структуру больше всего, потому что в ней акцепторный стебель лишь на 2 нуклеотида сдвинут относительно реального его положения, тогда как при других значениях параметров он либо вообще не определяется, либо оказывается сдвинут ещё сильнее). Вообще, если я правильно поняла принцип работы einverted, программа "складывает" молекулу пополам и выравнивает её участки между собой (по крайней мере, именно так выглядели все варианты, выдаваемые при различных комбинациях всех параметров). Структура же тРНК таким образом не может быть предсказана, потому что D- и T- стебли образованы дополнительными "складками" (боковыми петлями) этой сложенной пополам молекулы, и в выдаче мы видим, что эти участки спарены не с теми участками, с которыми они соединяются в реальной структуре, а с теми участками, которые оказываются напротив при складывании последовательности пополам. Акцепторный стебель эта программа определяет лучше, потому что он как раз образуется при спаривании двух концов последовательности, антикодоновый стебель тоже определяется относительно неплохо, потому что в нём задействованы основания, находящиеся ближе всего к середине последовательности и при её складывании оказывающиеся примерно напротив друг друга.

trna

Упражнение 2

Результат работы алгоритма Зукера (лучший вариант был получен при первом запуске) представлен на рисунке, сравнение результатов программы из 1 упражнения и алгоритма Зукера с реальной структурой в таблице.

z

Участок структуры

Позиции в структуре (по результатам find_pair)

Результаты предсказания
с помощью einverted

Результаты предсказания по алгоритму Зукера

Акцепторный стебель

5'-902-907-3'
5'-966-971-3'
Всего 6 пар

Предсказано 6 пар из 6 реальных и одна дополнительная, между 901U и 972А, нумерация в выдаче сдвинута относительно результата программы find_pair

6 пар из реальных 6 и одна дополнительная между 1 и 72 нуклеотидами

D-стебель

5'-910-912-3'
5'-923-925-3'
Всего 3 пары

Предсказано 0 пар из 3 реальных, 912 нуклеотид спарен с 959, хотя в реальной структуре он спарен с 925

3 пары из 3

T-стебель

5'-949-953-3'
5'-961-965-3'
Всего 5 пар

0 пар из 5 реальных

4 пары из 5 (между 27 и 43 нуклеотидами почему-то расстояние больше, чем между нуклеотидами в других парах, поэтому их наверное нужно считать не определённой парой)

Антикодоновый стебель

5'-927-931-3'
5'-939-943-3'
Всего 5 пар
(В выдаче find_pair этот участок больше, но в него входят неканонические взаимодействия, которые к стеблям относить нельзя)

Предсказано 0 пар из 5 реальных, но найденный стебель находится примерно там же, где и реальный, со сдвигом на 2 нуклеотида и состоит из 4 пар

3 пары из 5

Общее число канонических пар нуклеотидов

19

25, верных 5

16, все верные

Задание 2

Упражнение 1

Скачать скрипт с последовательным изображением структуры с выделенными множествами
Скачать скрипт с определениями множеств

Упражнение 2

Скачать скрипт с подсчётом контактов

Контакты атомов белка с

Полярные

Неполярные

Всего

остатками 2'-дезоксирибозы

4

23

27

остатками фосфорной кислоты

19

12

37

остатками азотистых оснований со стороны большой бороздки

4

11

15

остатками азотистых оснований со стороны малой бороздки

1

0

1

Можно заметить, что с атомами остатка сахара больше всего неполярных контактов (скорее всего, потому что в остатке сахара больше всего неполярных атомов углерода), а полярных контактов больше всего с остатками фосфорной кислоты (там больше полярных атомов кислорода). Контактов с остатками азотистых оснований со стороны малой бороздки значительно меньше, чем их же со стороны большой бороздки, вероятно, потому что малая бороздка стерически труднодступна, преобладание среди этих контактов неполярных опять же объясняется количеством неполярных атомов.

Упражнение 3

На картинках изображена популярная схема ДНК-белковых контактов, полученная с помощью программы nuclplot

1 1

Упражнение 4

Больше всего контактов с ДНК найдено для аминокислотных остатков 116 и 118 Arg, контакты между атомом азота аргинина и фосфором сахаро-фосфатного остова.
Для распознавания последовательности важны остатки, взаимодецствующие с конкретными нуклеотидами, а не сахарофосфатным остовом, таких на схеме немного: 116 Arg, связанный с 10 остатком гуанина цепи C нуклеиновой кислоты, 152 Asn, связанный с 7 тимином той же цепи и 150 Asn, связанный с 7 тимином противоположной цепи. Эти два контакта тоже могут быть важны для распознавания последовательности ДНК, потому что остатки 150 и 152 близки друг к другу и связаны именно с азотистыми основаниями, которые при этом тоже находятся рядом. Наиболее важным для распознавания последовательности ДНК, на мой взгляд, является 116 остаток аргинина, т.к. он образует сразу два контакта с азотистым основанием, а соседние с ним 117 и 118 остатки тоже образуют контакты с остовом нуклеиновой кислоты, что может обеспечить специфичное связывание. На картинках ниже проиллюстрированы контакты 116 остатка аргинина с ДНК.

1
Изображение 116 остатка аргинина и 10 нуклеотида цепи С гуанина, другие остатки и нуклеотиды сделаны прозрачными
1
Изображение 150 и 152 остатков аспарагина и 7 нуклеотида гуанина в каюдой из цепей, другие остатки и нуклеотиды сделаны прозрачными