Комплексы ДНК-белок

Задание 1 Предсказание вторичной структуры заданной тРНК.

1.1 Предсказание вторичной структуры тРНК путем поиска инвертированных повторов

Мне была выдана структура тРНК с PDB ID: 1f7u. Первой задачей было найти инвертированные участки в нуклеотидных последовательностях с помощью программы einverted из пакета EMBOSS. Программа ищет инвертированные повторы в ДНК и автоматически заменяет U на T, то есть может обрабатывать последовательность РНК без ручной конвертации. Ссылка для получения скачанной файла в fasta формате:

1f7u.fasta

Для нахождения возможных комплементарных участков в последовательности исследуемой тРНК я использовала команду: einverted 1ffy_trna.fasta -auto -threshold 15

Oops

Запуск einverted со стандартными параметрами Gap penalty[12] и Minimum match score[50] не дал никаких находок. При данном значении Minimum match score: 15 Были найден 2 участка, совпадающих на 100% с данными, полученными с использованием find_pair. При понижении и повышении других значений либо было много гэпов, либо отсутствовали 1й или 2й комплиментарных участка.

1.2 Предсказание вторичной структуры тРНК по алгоритму Зукера.

При вводе команд: export PATH=${PATH}:/home/preps/golovin/progs/bin cat my.fasta | RNAfold --MEA программа выдала такое предсказание:
1F7U:B UUCCUCGUGGCCCAAUGGUCACGGCGUCUGGCUNCGAACCAGAAGAUUCCAGGUUCAAGUCCUGGCGGGGAAGCCA ((((((((((((....))))))....(((((.......))))).....(((((.......))))).)))))).... (-26.80)
{(((((((((((....))))))).({((,(({{..{{{||,||.....|{,||}}}.,}.)),))})))))}.... [-28.57]
((((((((((((....))))))).((((...(...(((((...........)))))..)....))))))))).... {-20.10 d=13.98}
((((((((((((....))))))).((((.(((...(((((...........)))))..).)).))))))))).... {-24.70 MEA=54.37}
frequency of mfe structure in ensemble 0.0568212; ensemble diversity 17.89

Oops

Оптимальная вторичная структура в точечно-скобочной системе счисления с минимальной свободной энергией -26,80 ккал/моль была первой по счету в выводе программы.

1.3 Реальная и предсказанная вторичная структура тРНК из файла 1f7u.pdb

Таблица 1.
Участок структурыПозиции в структуре
(по результатам find_pair)
Результаты предсказания
с помощью einverted
Результаты предсказания
по алгоритму Зукера
Акцепторный стебель 5'-901-907-3'
5'-966-972-3'
Всего 7 пар
0 Предсказаны 6/7
D-стебель 5'-910-913-3'
5'-922-925-3'
Всего 4 пары
0 ПРедсказаны 6/4
T-стебель 5'-949-953-3'
5'-961-965-3'
Всего 5 пар
Предсказано 5 из 5 реальных Предсказаны 5/5
Антикодоновый стебель 5'-939-944-3'
5'-926-931-3'
Всего 6 пар
Предсказано 5 пар из 6 реальных ПРеедсказаны 5/6
Общее число канонических пар
нуклеотидов
Общее число 22 пары Общее число 10 пар Общее число 22 пары

Задание 2 Поиск ДНК-белковых контактов в заданной структуре

2.1 Вспомнить, как с помощью команды define JMol задавать множества атомов.

1)Определите множество атомов кислорода 2'-дезоксирибозы (set1).
2)Определите множество атомов кислорода в остатке фосфорной кислоты (set2).
3)Определите множество атомов азота в азотистых основаниях (set3).
4)Создайте скрипт-файл с определениями этих множеств:

Скрипт для множеств

Создайте скрипт-файл, вызов которого в JMol даст последовательное (с паузами!) изображение всей структуры, только ДНК в проволочной модели, той же модели, но с выделенными шариками множеством атомов set1, затем set2 и set3:

Скрипт Jmol

2.2 Контакты разного типа в комплексе

Мною был написан скрипт, определяющий значения контактоов разного типа в молекуле 1tro. Скрипт Jmol
Таблица 2.
Контакты атомов белка Полярные Неполярные Всего
Остатками 2'-дезоксирибозы 4 41 45
Остатками фосфорной кислоты 54 0 54
Остатками азотистых оснований со стороны малой бороздки 0 0 0
Остатками азотистых оснований со стороны большой бороздки 7 28 35

2.3-4 nucplot

Программа nucplot не выдала файл nucplot.ps для PDB ID:1tro. Отсутствие изображения из nucplot объясняется некорректной работой программы nucplot:
"In some cases, the graph-matching algorithm of HBADD fails and some of the atom-name mappings between the PDB file and the HET Group Dictionary are missed. This flaw will be rectified soon." Такая проблема уже возникала при работе с данным файлом в прошлых годах,а на вопрос, как лучше поступитьть в данном случае мне не смогли ответить,я решила поступить по примеру предыдущих годов и взять файл 1tro_old.bond. Согласно данным аминокислотный остаток с наибольшим числом контактов - это ARG69:
ARG C 54 NE C I 13 O1P 2.96
ARG C 69 NH1 G J 2 N7 2.87
Но более ключевым остатком для взаимодействия с ДНК является GLN68, так как он один образует водородные связи с разными азотистыми основаниями:
GLN C 68 N G J 2 O2P 2.92
GLN C 68 NE2 T J 3 O2P 2.97

Как пример-взаимодействие GLN68 с ДНК.

Oops