Posted Sunday, October 2, 2016. Renewed Saturday, October 1, 2016 by Marina Gladkova

Комплексы ДНК-белок

Суть работы - сравнительный анализ канонической ДНК и стеблей тРНК.


Задание 1.

Предсказание вторичной структуры заданной тРНК.[1]


Упражнение 1.

Предсказание вторичной структуры тРНК путем поиска инвертированных повторов.
Программа einverted из пакета EMBOSS позволяет найти инвертированные участки в нуклеотидных последовательностях, на вход получая последовательность нуклеотидов (USA), как, например, в файле данной мне тРНК 1f7u.fasta. На выходе мы имеем два файла: [sequence.fasta], с данными о полученных комплементарных участках, и [sequence.inv], показывющий водородные связи в пределах этих участков. При попытке запуска программы со стандартными параметрами создавались пустые файлы, поэтому для получения предсказания наиболее близкого к реальной структуре параметр "Minimum score threshold" был изменен с базового (50), на подобранный (15), при котором появился первый и, видимо, наиболее удачный результат. По результатам сравнения с find_pair программа einverted смогла верно предсказать структуру T-стебля и сделала ошибку со сдвигом на 1 основание в структуре D-стебля.


Упражнение 2.

Предсказание вторичной структуры тРНК по алгоритму Зукера.

Другая программа RNAfold из пакета Vienna RNA Package, которая реализует алгоритм Зукера. RNAfold принимает на вход последовательность, вторичную структуру РНК рассчитывает с учетом минимальной свободной энергией (mfe), на выходе дает файл в формате DBN (Dot-Bracket Notation). Точками обозначаются нуклеотиды без пары, спаренные - круглыми скобками. Псевдоузлы отмечены круглыми и квадратными скобками. Для моей тРНК RNAfold сработала недостаточно хорошо, что подтверждают данные онлайн-сервиса о низкой вероятности образования пар. По его рассчету возможна отличная от клевера структура - РНК-центроид, вторичная структура с минимальным расстоянием пар оснований относительно остальной части молекулы в ансамбле Больцмана. RNAfold почти идеально предсказала 2 из 4 стеблей, для двух других предсказание оказалось очень сильно отличающимся от других программ.
В целом, результаты работы 3 программ получились достаточно неоднозначными, чтобы делать выводы об их эффективности, а для предсказания структуры тРНК с PDB ID 1f7u требуется использование стороннего софта и дополнительное исследование.

Реальная и предсказанная вторичные структуры тРНК из файла 1f7u.pdb
Участок структурыПозиции в структуре (результаты find_pair) Результаты предсказания с помощью einverted Результаты предсказания по алгоритму Зукера
Акцепторный стебель5`-901-907-3`
5`-966-972-3`
всего 7 пар
предсказано 0 пар из 7 реальных предсказано 6 пар из 7 реальных,
не хватает связи между парой оснований 5`-907-966-3`
D-стебель5`-939-944-3`
5`-926-931-3`
всего 6 пар
предсказано 5 пар из 6 реальных,
отсутствует пара 5`-926-944-3`
предсказано 0 пар из 5 реальных
T-стебель5`-949-953-3`
5`-961-965-3`
всего 5 пар
верно предсказаны все 5 из 5 пар,
начало и конец совпадают
верно предсказан весь стебель
Антикодоновый стебель5`-910-913-3`
5`-922-925-3`
всего 4 пары
предсказано 0 из 4 пар предсказано 0 из 4 пар
Общее число канонических пар нуклеотидов231011


Предсказанная вторичная структура тРНК с минимальной свободной энергией, RNAfold Точечный график. Показывает вероятность образования пар оснований, RNAfold


Задание 2.

Поиск ДНК-белковых контактов в заданной структуре

Упражнение 1.

Задание множества атомов с помощью команды define в программе JMol.


~ Множество атомов кислорода 2'-дезоксирибозы (o_in_dr). ~ Множество атомов кислорода в остатке фосфорной кислоты (o_in_ph).
~ Определите множество атомов азота в азотистых основаниях (n_in_base).
~ Cкрипт-файл, вызов которого в JMol даст последовательное (с паузами) изображение всей структуры, только ДНК в проволочной модели, той же модели, но с выделенными шариками множеством атомов o_in_dr, затем o_in_ph и n_in_base.


Для загрузки апплета нажмите на изображение. Для запуска скрипта используйте кнопку Start script, для продолжения работы скрипта - Resume.




Упражнение 2.

Описание ДНК-белковых контактов в заданной структуре. Сравнение количества контактов разной природы.
Будем считать полярными атомы кислорода и азота, а неполярными - атомы углерода, фосфора и серы. Назовем полярным контактом ситуацию, в которой расстояние между полярным атомом белка и полярным атомом ДНК меньше 3.5Å. Аналогично, неполярным контактом будем считать пару неполярных атомов на расстоянии меньше 4.5Å.

Контакты разного типа в комплексе 1tro.pdb
Контакты атомов белка с: ПолярныеНеполярныеВсего
остатками 2'-дезоксирибозы05757
остатками фосфорной кислоты5448102
остатками азотистых оснований со стороны большой бороздки114455
остатками азотистых оснований со стороны малой бороздки044

Исследование ДНК-белковых контактов показало:
  • Отсутствие полярных контактов белка с остатками дезоксирибозы. Возможное объяснение: трудная стерическая доступность O-атомов 2'-дезоксирибозы, повернутых внутрь двойной спирали.
  • Большое количество неполярных контактов незаряженных аминоксилот (Q, N, S, T, G, A) с остатками декзоксирибозы.
  • Наибольшее количество контактов обнаружено между белком и остатками фосфорной кислоты. К ним фотянутся положительно заряженные аминокислоты - K и R, в целом, фосфаты лучше всего контактируют с разнообразными аминокислотами, так хорошо доступны.
  • Что интересно, полярные контакты большой бородки ДНК реализуются только за счет аргинина (R), потому как данная аминоксилота положительно заряжена и достаточно крупная.
  • Многочисленные неполярные контакты азотистых оснований большой бороздки с аминокислотами.
  • В малой бороздке, куда доступ молекул сильно ограничен удалось обнаружить 4 неполярных контакта с глицином (G). Из-за отсутствия заряда и маленького размера он единственный способен преодолеть пространственные преграды.


Упражнение 3.

Получение. популярной схемы ДНК-белковых контактов с помощью программы nucplot.

ДНК-белковые контакты в комплексе 1TRO на схеме, полученной командой nucplot

Условные обозначения:
пятиугольник - сахар остова с номером основания; P в кружке - фосфатная группа
* - дополнительные контакты; синий штрих - водородные связи
красный штрих - интересующие нас контакты; W - вода

Программа nucplot результатом выдачи имеет популярную схему комплекса ДНК-белок в .ps формате, которая легко переводится в изображение. Она работает только со старым форматов .pdb, поэтому нужно конвертировать файл в программе remediator. К сожалению, при работе с nuplot возникла ошибка сегментации, которую я не смогла устранить. Я провела поиск нужной мне схемы в нескольких базах данных и в итоге нашла необходимое изображение в базе PDIdb.

Упражнение 4.

Из представленной схемы следует, что:

  • Аминокислотные остатки с наибольшим числом указанных на схеме контактов с ДНК - Arg54(C) (3 контакта с одним фосфатом) и Arg54(A), Thr44(C), Lys90(C), Arg54(A) - у всех по 2 контакта с остатком фосфорной кислоты. (A)
  • Белок 1TRO является репрессором trp, т.е. регулирует транскрипцию триптофана. Один из генов, регулируемых репрессором Trp, TRpr, кодирует сам белок триптофанового репрессора. Это является одной из форм регулирования с обратной связью. [2] Его структура имеет обширую контактную поверхность, образуя водородные связи и солевые мостики с ДНК. Непосредственных H-связей или неполярных контактов с основаниями, которые могли бы объяснить специфичность репрессора к последовательности оператора, нет. Вероятнее всего, последовательность оператора распознается косвенным путем, благодаря эффектам, возникающим из геометрии фосфатного остова, которые формируют стабильный интерфейс. Гидратационные полярные контакты с основаниями тоже, по предположению, влияют на специфичность. [3]Как мы можем наблюдать на схеме, в комплексе на каждое азотистое основание (за исключением 4) приходится от одной до четырех связей с молекулами воды.
    Очевидно, что для распознавания последовательности ДНК наиболее важны аминокислотные остатки, специфически контактирующие непосредственно с остатками азотистых оснований. Не совсем очевидно, почему на схеме nucplot не указаны многочисленные неполярные контакты, рассмотренные мной в ходе работы с Упр.2. На популярной схеме, где не отображены непосредственные контакты аминокислотные остатков с основаниями, можно наблюдать связывание Thr81(A) и Thr81(С) с фосфатными остатками, что проиллюстировано на изображении ниже (показаны только группы в пределах региона контакта).

    Полярный ДНК-белковый контакт (Thr81(A) и фосфат, изображение получено с помощью JMol)

Источники