Предсказание структуры РНК. Поиск ДНК-белковых контактов.

Предсказание вторичной структуры РНК

Файл с последовательностью tRNAPro(CGG) бактерии Thermus thermophilus (PDB ID 1H4S) в fasta-формате 1H4S.fasta был загружен со страницы PDB.
Замечание: В pdb-файле дана неполная последовательность тРНК - с 4 по 69 нуклкотид из 77 нуклеотидов в fasta-файле. Хуже того, имеется несколько нетрадиционный способ нумерации в pdb-файле - после 17 нуклеотида идёт 17^A нуклеотид, а только за ним 18, поэтому нумерация после 17 нуклеотида отличается в выводе einverted, в отчёте использована нумерация из файла pdb. Тимидин и псевдоуридин в fasta-файле обозначены как уридин.

С помощью программ einverted, ищущей комплементарные участки цепи, и RNAfold, выполняющей алгоритм Зукера предсказания вторичной структуры РНК, была предсказана вторичная структура данной тРНК, результаты предсказаний сравнены с выводами программы find_pair на основании структуры PDB:

  • Программа einverted предсказывает вторичную структуру РНК, ища комплементарные участки цепи, учитывая при этом только канонические пары нуклеотидов. Спирали отбираются по счёту (параметр -threshold), сформированного баллами за нахождения в спирали комплементарных пар (параметр -match), выпетливаний (параметр -gap) или внутренних петель (параметр -mismatch).

    Данный метод предсказания оказался довольно неточным: при различных сочетаниях параметров предсказывалась одна из 4 структур (или не предсказывалось ничего):
    1. только Acceptor-stem (например, при запуске с параметрами -gap 10 -threshold 20 -match 7 -mismatch -10),
    2. участок TψC-stem с большим количеством лишних пар (например, при запуске с параметрами -gap 10 -threshold 20 -match 8 -mismatch -10),
    3. вся молекула со вторичной структурой типа helix-bulged helix-helix-loop c правильно определёнными Acceptor-stem и Anticodon-stem (например, при запуске с параметрами -gap 10 -threshold 20 -match 9 -mismatch -10),
    4. похожа на структуру 3, в Anticodon-loop лишние пары (например, при запуске с параметрами -gap 10 -threshold 20 -match 10 -mismatch -10).

    Лучшей из этих структур можно считать третью:

  • Программа RNAfold для предсказание вторичной структуры РНК реализует алгоритм поиска структуры с минимальной свободной энергией образования (MFE structure). Параметр --MEA позволяет помимо MFE structure рассчитывать вероятность образования пары для каждого основания и отображать (в скобочной записи) структуру, в которой отмечены пары с достаточно большой (чем больше значение параметра, тем меньше порог) вероятностью образования пары.

    Метод предсказания с первого запуска (с параметром --MEA=1 по умолчанию) дал довольно близкий к действительности результат: все стебли предсказаны верно, кроме предсказания лишней пары внутри Anticodon-loop и отсутствия пары AG − первой пары Anticodon-stem, несмотря на параметр --nsp -AG (учитывает возможность неканонической пары AG). Увеличения параметра --MEA (что должно позволять предсказывать пару между нуклеотидами, имеющими невысокую вероятность образования таковой) не добавляет первую пару в антикодоновый стебель, но предсказывает лишние 2 пары в D-loop.

    Таким образом, лучшая структура:


Сравнение со структурой pdb:

Участок структурыПозиции в структуре (по результатам find_pair из pdb)Результаты предсказания с помощью einvertedРезультаты предсказания с помощью RNAfold
Acceptor-stem5'-4-7-3'
5'-66-69-3'
Всего 4 пары, из них 0 неканонических
предсказано 4 пары из 4 в pdb + 3 пары, отсутствующие в pdbпредсказано 4 пары из 4 в pdb + 3 пары, отсутствующие в pdb
D-stem5'-10-13-3'
5'-22-25-3'
Всего 4 пары, из них 0 неканонических
предсказано 4 пары из 4 реальных
Anticodon-stem5'-26-32-3'
5'-38-44-3'
Всего 7 пар, из них 1 неканоническая
предсказано 6 пар из 7 реальныхпредсказано 6 пар из 7 реальных + 1 лишняя пара
TψC-stem5'-49-53-3'
5'-61-65-3'
Всего 5 пар, из них 1 неканоническая
предсказано 5 пар из 5 реальных
Общее число канонических пар нуклеотидов181321

(полученные файлы хранятся в директории ~stepan_puhov/term3/block1/pr3/rnastructure)


Поиск ДНК-белковых контактов

ДНК-белковые контакты в комплексе домена MH1 белка SMAD3 человека с ДНК (PDB ID 1MHD) были сначала визуализированы с помощью JMol, а затем с помощью программы nucplot.
Файл 1MHD.pdb был загружен с сайта PDB, затем переведён программой remediator в старый формат (PDBv2.3) 1MHD_old.pdb для дальнейшей обработки программмой nucplot, все дальнейшие операции проводились с этим файлом (т.е. скрипты JMol были написаны под старый формат). Файл содержит 2 одинаковых белка, образующих комплексы с разными (отдалёнными) участками ДНК, исследовалось взаимодействие только одного белка с ДНК − цепь A в pdb.

(полученные файлы хранятся в директории ~stepan_puhov/term3/block1/pr3/complexstructure)

Визуализация молекулы ДНК в JMol

Написаны 2 скрипта для JMol:

  • Скрипт, задающий множество атомов кислорода дезоксирибозы как "set1", множество атомов килорода фосфатных остатков ДНК − как "set2" и множество атомов азота в азотистых основаниях − как "set3".
  • Скрипт, последовательно показывающий всю исследуемую структуру (цепь A и ДНК); только молекулу ДНК в проволочной модели; в этой модели выделены шариками только атомы из set1; выделены шариками только атомы из set2; выделены шариками только атомы из set3.

Визуализация контактов в JMol

Определим атомы кислорода и азота как полярные, а атомы углерода, фосфора и серы − как неполярные.
Определим полярный контакт как пару полярных атомов ДНК и белка, находящихся на расстоянии меньшим 3.5Å, и неполярный контакт − как пару неполярных атомов ДНК и белка, находящихся на расстоянии меньшим 4.5Å (при таком определении один атом может участвовать сразу в нескольких контактах).

Был написан скрипт для JMol последовательно визуализирующий для исследуемой структуры атомы дезоксирибозы; атомы фосфатных остатков ДНК; атомы азотистых оснований, направленные в большую бороздку; атомы азотистых оснований, направленные в малую бороздку; полярные и неполярные контакты белка с перечисленными множествами атомов.

Результаты подсчёта этих контактов приведены в таблице:

Контакты атомов белка сПолярныеНеполярныеВсего
остатками 2'-дезоксирибозы167
остатками фосфорной кислоты516
остатками азотистых оснований со стороны большой бороздки61016
остатками азотистых оснований со стороны малой бороздки000

При данном определении контактов именно полярные контакты будут скорее всего вносить значимый вклад во взаимодействие белка с ДНК. Видно, что больше всего полярных контактов белок образует с фосфатными остатками и атомами азотистых оснований, ориетированными в большую бороздку − с помощью этих контактов белок связывается с ДНК. Больше всего контактов белок образует с большой бороздкой, тогда как с малой бороздкой контакты отсутствуют (на визуализации явно видно, что белок далеко отстоит от малой бороздки) − узнавание последовательности ДНК происходит по большой бороздке.

Поиск контактов через nucplot

Визуализация контактов программой nucplot. Здесь отмечены контакты также для другой молекулы белка, цепи B; поскольку цепь B в исследуемую структуру не входит, ниже описываются контакты только для цепи A.

Больше всего контактов c ДНК образует остаток Arg74 − 2 водородные связи c гуанином (nucplot cчитает, что остаток Lys81 также образует 2 контакта без связей, но JMol рассчитывает 1 из этих контактов как водородную связь, второй контакт является просто близким положением):


За узнавание ДНК скорее всего отвечают аминокислотные остатки Arg74, образующий 2 водородные связи с гуанином, и Lys81, образующий 1 водородную свзязь с атомом N7 аденина, а также, возможно, остаток Gln76, ориентирующий Lys81 водородной связью и, что кажется вероятным из структуры, но не определяется командой calculate hbonds JMol, может образовывать водородную связь с тем же аденином по атому N6 (это водородная связь была обозначена чёрным отрезком):


Главная страница


© Степан Пухов

2019