Главная страница

Исследование белок-нуклеиновых контактов



1. Получение PDB-файлов со структурами.

По заданному коду 1rr8 были получены PDB-файлы с сайта PDB и с сайта Macromolecular Structure Database EBI : 1RR8.pdb, 1rr8_mmol.pdb. Данные файлы практически идентичны.

2. Исследование контактов между молекулами белка и ДНК

В файле dna.def заданы следующие множества атомов:
- base — все атомы оснований ДНК;
- mjg — атомы оснований ДНК, обращённые в большую бороздку;
- mig — атомы оснований ДНК, обращённые в малую бороздку.
Для дальнейшей работы необходимо задать множества полярных и неполярных атомов ДНК и белка. Эти множества представлены в файле polar.def

Поиск атомов, образующих контакты, осуществляется с помощью скрипта interact.scr.
После выполнения поиска были получены следующие результаты:

Контакты разного типа в комплексе 1RR8.
Контакты белка с... Полярные Гидрофобные Всего
...остатками 2`-дезоксирибозы 6 11 17
...остатками фосфорной кислоты нет нет нет
...остатками азотистых оснований со стороны большой бороздки 40 1 41
...остатками азотистых оснований со стороны малой бороздки 2 нет 2


Таким образом, наибольшее количество контактов связывает полярные остатки оснований со стороны большой бороздки и полярные атомы белка. Вообще полярных контактов (49) значительно больше, чем гидрофобных (12); последние в основном представлены взаимодействием белка с дезоксирибозой.

3. Поиск специфических контактов, обеспечивающих узнавание сайта в молекуле ДНК
Поиск специфических контактов следует производить между атомами оснований ДНК и белка. Для этого с помощью команды
select within (3.5, base) and pol_protein
выберем атомы белка, которые могут образовывать полярные связи с основаниями. Таких связей две: T10 – Lys532 и A113-Arg364. Интересно, что T10 и A113 образуют комплементарную пару в цепи ДНК. На первый взгляд трудно понять, какая из связей имеет большее значение при связывании молекул ДНК и белка, поэтому при дальнейшей работе рассматривались обе связи.

Связь T10 – Lys532:

Связь A113-Arg364:

Обе структуры:


4. Описание функций исследуемого белка

При изучении документа UniProt, а также соответствующих доменов в Pfam были получены следующие данные.

Данный белок является ДНК-топоизомеразой I. Топоизомеразы регулируют число топологических связей между цепями ДНК, т.е. изменяют число суперспиральных витков. Они катализуют одно- и двуцепочечные разрывы ДНК, перекрещивают цепи, затем устраняют разрывы. Устранение суперспирализации ДНК может требоваться:
- во время транскрипции и репликации ДНК;
- для разрыва цепей во время рекомбинации;
- для конденсации хромосом;
- для распутывания переплетений ДНК во время митоза.

ДНК-топоизомеразы делятся на два класса. Данная топоизомераза относится к классу I. Это – АТФ-независимые ферменты, отвечающие за снятие плюс- или минус-суперспирализации ДНК.

В структуре топоизомераз находится, как правило, два функционально важных домена, а именно - ДНК-связывающий и собственно каталитический, их семейства в Pfam имеют названия соответственно Topoisom_I_N и Topoisom_I.
В данной последовательности эти домены находятся в следующих позициях: Topoisom_I_N: 215-429, Topoisom_I: 432-673. Очевидно, что рассмотренные выше аминокислотные остатки Lys532 и Arg364 относятся к разным доменам белка. Рассмотрим обе позиции.

1. Домен Topoisom_I_N и Arg364. Для данного домена было получено полное выравнивание, из которого можно заключить, что остаток Arg364 в составе белка можно отнести к консервативным. Из 87 случаев лишь в в 5 эта позиция подвергалась изменениям, а именно:
- TOP1_DAUCA - замена на серин. Данная замена существенна, т.к. в нашем случае аргинин связывается с ДНК за счет концевой группы NH2 на радикале. Структура радикала серина является совершенно иной.
- Q56XA_APATH, Q3ULF5_MOUSE, Q504F2_BRARE, Q71H54_MOUSE - в позиции находится гэп. Что касается Q56XA_APATH, Q3ULF5_MOUSE и Q71H54_MOUSE, то они в целом проявляют достаточно слабую гомологию с остальными доменами этого семейства, и в их последовательностях гэпы соответствуют большим промежуткам аминокислот, то есть говорить о консервативности данного остатка не имеет смысла. У Q504F2_BRARE гомологичен только начальный фрагмент домена, а фрагмент, соответствующий рассматриваемому (с аргинином) отсутствует.
Таким образом, для Arg364 в данном выравнивании существует только одна замена, возможно, имеющая биологический смысл.

2. Домен Topoisom_I и Lys532.
Выравнивание для этого домена состоит из 147 последовательностей. Проанализировав выравнивание, можно заключить, что остаток Lys532 является еще более консервативным, чем аргинин. Лишь в четырех случаях (Q8RXI5_ARATH, Q3TSR2_MOUSE, Q6IQI8_BRARE, Q9BVT2_HUMAN) в этой позиции наблюдается не лизин, а гэп, но в этих случаях отсутствуют достаточно длинные фрагменты, включающие этот остаток, и общая гомология с нашим доменом достаточно мала.
Возможно, лизин относится к остаткам, непосредственно осуществляющим катализ, а подобные остатки являются высококонсервативными в одном семействе ферментов.

5. Построение схемы контактов белка с ДНК

После выполнения команды

nucplot 1rr8.pdb

в программе nucplot было получено следующее изображение:

При его изучении можно заметить некоторые отличия от результатов, полученных с помощью Rasmol. Отличия следующие:

- программой nucplot рассматривались также взаимодействия ДНК с молекулами воды и гидрофобные взаимодействия с остатками фосфорной кислоты;
- присутствует только два полярных контакта с дезоксирибозой и один неполярный. Меньшее количество контактов, возможно, связано с тем, что при работе с Rasmol, фактически, учитывались не реальные контакты, а возможность их образования (т.е. малое расстояние между соответствующими атомами). Кроме того, не учитывалось взаимодействие с молекулами воды, которое также может изменять картину образования контактов.
Что касается специфических взаимодействий ДНК с белком, то здесь результаты те же, что и при работе в Rasmol: обнаружены рассмотренные выше остатки аргинина и лизина, а других не показано.


©Сорочкина Александра