Последовательность нуклеотидов тРНК с 3D-структурой 2cv0 была скачана с соответствующего сайта PDB, но также она могла быть получена с NDB под другим идентификатором. Поиск канонических пар в стеблях вначале осуществлялся с помощью команды "einverted" пакета "EMBOSS".
einverted 11.fasta -gap 15 -thr 10 -match 4 -mis -10 -outfile 1.inv -outseq 1.fasta
Относительно адекватные результаты дали параметры: штраф за гэп 15, порог очков не менее 10, 4 очка за совпадение, -10 за несовпадение. Но и они ничего не сказали про T- и D- стебли, только про акцепторный и антикодоновый. Результат выравнивания доступен по ссылке.
Помимо метода инвертируемых пар использовался алгоритм Зукера, его запуск, перевод постскирпт файла в pdf и конечный результат предоставлены ниже.
export PATH=${PATH}:/home/preps/golovin/progs/bin
cat 11.fasta | RNAfold --noconv --MEA
ps2pdf rna.ps rna.pdf
Первая команда служит для указания пути к программе "RNAfold", вторая - собственно запуск (отключение автозамены урацила на тимин как то не показало себя), последняя - перевод .ps файла в .pdf. Результат работы (вторая попытка) можно скачать по ссылке и наблюдать на рисунке.
Результаты представлены в таблице ниже.
Участок структуры | Позиции в структуре (по результатам find_pair) | Результаты предсказания с помощью einverted | Результаты предсказания по алгоритму Зукера |
---|---|---|---|
Акцепторный стебель | 5'-503---570-3' 3'-507---566-5': 5 пар оснований | Предсказаны 5 из 5, две лишних (почему-то со сдвигом на 1), две лишние | Предсказаны 5 из 5 |
D-стебель | 5'-510---525-3' 3'-512--523-5': 3 пары оснований | Предсказаны 0 из 3 | Предсказаны 3 из 3 + 2 лишние |
T-стебель | 5'-549---565-3' 3'-553--561-5': 5 пар оснований | Предсказаны 4 пары из 5 + 1 лишняя | Предсказаны 5 пар из 5 |
Антикодоновый стебель | 5'-539---531-3' 3'-543--527-5': 5 пар оснований | Предсказаны 0 из 5 | Предсказаны 5 из 5 |
Общее число канонических пар нуклеотидов | 18 | Предсказаны 14, 4 из них совершенно правильно, 5 со сдвигом в 1 на 3' цепи, 5 лишние | Предсказаны 20, 18 правильно, 2 лишние |
Изображение представлено в виде работы скрипта в веб-апплете. Этапы отображения: структура комплекса ДНК-белок, структура ДНК в проволочной модели, та же структруа с множеством атомов кислорода 2'-дезоксирибозы (set1), та же модель с множеством атомов кислорода в остатке фосфорной кислоты (set2), аналогично с множеством атомов азота в азотистых основаниях (set3).
Контакты определены как количество атомов белка (полярных - азот/кислород и неполярных - углерод/сера/фосфор), находящихся на расстоянии не более 3.5 ангстрем от полярного атома ДНК (атом белка тоже должен быть полярным) или находящихся на расстоянии не более 4.5 ангстрем от неполярного атома ДНК (аналогично белковый атом должен быть неполярным). Скрипт с определением множеств, операциями над ними и подсчетом мощности можно просмотреть по ссылке. Таблица с результатами подсчета контактов между определнными частями ДНК и белком представлена ниже.
Контакты атомов белка с | Полярные | Неполярные | Всего |
---|---|---|---|
остатками 2'-дезоксирибозы | 7 | 47 | 54 |
остатками фосфорной кислоты | 25 | 29 | 54 |
остатками азотистых оснований со стороны большой бороздки | 6 | 8 | 14 |
остатками азотистых оснований со стороны малой бороздки | 0 | 2 | 2 |
Результаты подсчета необычны лишь двумя фактами: количества контактов с дезоксирибозой и фосфорной кислотой совпали и полярные контакты с малой бороздкой полностью отсутствуют. Возможно, первое неслучайно, второе может быть обусловлено труднодоступностью малой бороздки. Направление атомов в сторону конкретной бороздки определялась по 20 слайду презентации.
3D-структура ДНК-белкового комплекса была скачена с соответствующей страницы PDB. Для работы с nucplot на была перевдена в старую форму записи:
remediator --old '1dfm.pdb' > '1dfm_old.pdb'
nucplot 1dfm_old.pdb
Последней командой был инициирован запуск самого nucplot, в результате образовался постскрип файл, который после был переведен в pdf.
ps2pdf nucplot.ps
В итоге было получена популярная схема ДНК в более известном формате, увидеть ее можно по ссылке.
При просмотре изображения было выяснено, что аминокислота аспаргин 140 из цепи B имеет максимальное количество контактов с белком - она упоминается 5 раз. Что интересно, соответственная аминокислота из цепи A уступает лишь на один контакт и располагается симметрично. Возможно, что именно они обеспечивают упаковку ДНК в комплекс. Поэтому в качестве важной для комлекса была рассомтрена аминокислота [Asn]140:A. Изображения этих аминокислот в визуализаторе JMol представлены ниже.