Практикум 4. Комплексы ДНК-белок.

Предсказание вторичной структуры заданной тРНК

Предсказание вторичной структуры тРНК путем поиска инвертированных повторов

Последовательность нуклеотидов тРНК с 3D-структурой 2cv0 была скачана с соответствующего сайта PDB, но также она могла быть получена с NDB под другим идентификатором. Поиск канонических пар в стеблях вначале осуществлялся с помощью команды "einverted" пакета "EMBOSS".

einverted 11.fasta -gap 15 -thr 10 -match 4 -mis -10 -outfile 1.inv -outseq 1.fasta
        

Относительно адекватные результаты дали параметры: штраф за гэп 15, порог очков не менее 10, 4 очка за совпадение, -10 за несовпадение. Но и они ничего не сказали про T- и D- стебли, только про акцепторный и антикодоновый. Результат выравнивания доступен по ссылке.

Предсказание вторичной структуры тРНК по алгоритму Зукера

Помимо метода инвертируемых пар использовался алгоритм Зукера, его запуск, перевод постскирпт файла в pdf и конечный результат предоставлены ниже.

export PATH=${PATH}:/home/preps/golovin/progs/bin
cat 11.fasta | RNAfold --noconv --MEA
ps2pdf rna.ps rna.pdf

Первая команда служит для указания пути к программе "RNAfold", вторая - собственно запуск (отключение автозамены урацила на тимин как то не показало себя), последняя - перевод .ps файла в .pdf. Результат работы (вторая попытка) можно скачать по ссылке и наблюдать на рисунке.

Вторичная структура PR0163 построенная алгоритмом Зукера
Рисунок 1. Вторичная структура PR0163 построенная алгоритмом Зукера

Сравнение алгоритмов

Результаты представлены в таблице ниже.

Таблица 1. Сравнение алгоритмов по поиску комплементарных пар
Участок структуры Позиции в структуре (по результатам find_pair) Результаты предсказания с помощью einverted Результаты предсказания по алгоритму Зукера
Акцепторный стебель 5'-503---570-3' 3'-507---566-5': 5 пар оснований Предсказаны 5 из 5, две лишних (почему-то со сдвигом на 1), две лишние Предсказаны 5 из 5
D-стебель 5'-510---525-3' 3'-512--523-5': 3 пары оснований Предсказаны 0 из 3 Предсказаны 3 из 3 + 2 лишние
T-стебель 5'-549---565-3' 3'-553--561-5': 5 пар оснований Предсказаны 4 пары из 5 + 1 лишняя Предсказаны 5 пар из 5
Антикодоновый стебель 5'-539---531-3' 3'-543--527-5': 5 пар оснований Предсказаны 0 из 5 Предсказаны 5 из 5
Общее число канонических пар нуклеотидов 18 Предсказаны 14, 4 из них совершенно правильно, 5 со сдвигом в 1 на 3' цепи, 5 лишние Предсказаны 20, 18 правильно, 2 лишние

Поиск ДНК-белковых контактов в заданной структуре

Отображение ДНК в JMol

Изображение представлено в виде работы скрипта в веб-апплете. Этапы отображения: структура комплекса ДНК-белок, структура ДНК в проволочной модели, та же структруа с множеством атомов кислорода 2'-дезоксирибозы (set1), та же модель с множеством атомов кислорода в остатке фосфорной кислоты (set2), аналогично с множеством атомов азота в азотистых основаниях (set3).



Отображение контактов ДНК в "JMol"

Контакты определены как количество атомов белка (полярных - азот/кислород и неполярных - углерод/сера/фосфор), находящихся на расстоянии не более 3.5 ангстрем от полярного атома ДНК (атом белка тоже должен быть полярным) или находящихся на расстоянии не более 4.5 ангстрем от неполярного атома ДНК (аналогично белковый атом должен быть неполярным). Скрипт с определением множеств, операциями над ними и подсчетом мощности можно просмотреть по ссылке. Таблица с результатами подсчета контактов между определнными частями ДНК и белком представлена ниже.

Таблица 2. Количества контактов разного типа в комплексе 1DFM
Контакты атомов белка с Полярные Неполярные Всего
остатками 2'-дезоксирибозы 7 47 54
остатками фосфорной кислоты 25 29 54
остатками азотистых оснований со стороны большой бороздки 6 8 14
остатками азотистых оснований со стороны малой бороздки 0 2 2

Результаты подсчета необычны лишь двумя фактами: количества контактов с дезоксирибозой и фосфорной кислотой совпали и полярные контакты с малой бороздкой полностью отсутствуют. Возможно, первое неслучайно, второе может быть обусловлено труднодоступностью малой бороздки. Направление атомов в сторону конкретной бороздки определялась по 20 слайду презентации.

Схема ДНК-контактов из программы "nucplot"

3D-структура ДНК-белкового комплекса была скачена с соответствующей страницы PDB. Для работы с nucplot на была перевдена в старую форму записи:

remediator --old '1dfm.pdb' > '1dfm_old.pdb'
nucplot 1dfm_old.pdb

Последней командой был инициирован запуск самого nucplot, в результате образовался постскрип файл, который после был переведен в pdf.

ps2pdf nucplot.ps

В итоге было получена популярная схема ДНК в более известном формате, увидеть ее можно по ссылке.

При просмотре изображения было выяснено, что аминокислота аспаргин 140 из цепи B имеет максимальное количество контактов с белком - она упоминается 5 раз. Что интересно, соответственная аминокислота из цепи A уступает лишь на один контакт и располагается симметрично. Возможно, что именно они обеспечивают упаковку ДНК в комплекс. Поэтому в качестве важной для комлекса была рассомтрена аминокислота [Asn]140:A. Изображения этих аминокислот в визуализаторе JMol представлены ниже.

Аминокислота [Asn]140:A с измеренными растояниями до ДНК
Рисунок 2. Аминокислота [Asn]140:A с измеренными растояниями до ДНК
Аминокислота [Asn]140:B с измеренными растояниями до ДНК
Рисунок 3. Аминокислота [Asn]140:B с измеренными растояниями до ДНК