Исследование белок-нуклеиновых контакотв.

При сравнении 2 PDB структур (1r4i.pdb, 1r4i_o.pdb), Выяснилось что фрагменты ДНК имеют длину 58,9 А, правозакрученные, шаг спирали - 36,6 А, плюс внешнее сходство: из этого можно сделать вывод что фрагменты одинаковы. Используяя второй файл, необходимо было найти количество следующих контактов ДНК с белком:
  Полярные Гидрофобные Всего
Контакты белка с ...      
... остатками 2'-дезоксирибозы 2 7 9
... остатками фосфорной кислоты 26 15 41
... остатками азотистых оснований со стороны большой бороздки 0 0 0
... остатками азотистых оснований со стороны малой бороздки 0 0 0

Как видно из таблицы, белок не контактирует с ДНК в области больших и малых бороздок, а больше всего контактов с остатками фосфорной кислоты, причем преобладают полярные.
Скрипт, с помощью которого были получены эти данные:
select within (3,5, *.O?P*) and not dna and polar
select within (4,5, *.O?*P) and not dna and hydrophobic
select within (3,5, *.C?*) and not dna and polar
select within (4,5, *.C?*) and not dna and hydrophobic
select within (3,5, (oxygen,nitrogen)) and not dna and polar
select within (4,5, (oxygen,nitrogen)) and not dna and hydrophobic
Далее мне необходимо было найти наиболее интересный специфический контакт между белком и ДНК. Я выбрала контакт с His553: связываются азот гистидина и кислород из Т20. Длина связи - 2,8 А, предположительно полярная. Этот контакт есть на цепи А и В и симметричен, находится у крайних нуклеотидов. Возможно, отвечает за специфичность связывания. Красная структура - гистидин, синяя - тимин. Ниже приведена структура:


Следующим пунктом был поиск информации о белке и ДНК из данного файла. В базе Uniprot, при подаче запроса Androgen receptor, был выдан 1 резульат с подходящим синонимом и организмом (Dehydroprotestosterone receptor, Rattus norvegicus) - P15207. Проанализировав этот файл, выяснилось, что данный белок, являясь стероидным гормоном, отвечает за регуляцию экспрессии генов и влияет на клеточную пролиферацию и дифференциацию в тканях. Соединяется с ДНК в качестве гомодимера, а также с многими другими веществами в присутствии посредников. Этот белок состоит из 3 доменов: N-терминальный, ДНК-связывающий и С-терминальный (связывается со стероидами). Проведя поиск в базе данных Pfam, выяснила, что ДНК-захватывающий домен этого белка состит из 2 структр, называемых цинковым пальцем. Первая структура служит для распознования ДНК, вторая - для димеризации. Семейство подобных доменов характеризуется высокой консервативностью и специфичностью,поскольку присоединяются только к определенным генам, активируя или репрессируя его. Кроме того, ДНК-связывающие домены участвуют в ядерной локализации, связывании с факторами транскрипции и т.д.

На сайте Pfam также есть выравнивание доменов из этого семейства в формате MSF:
                                                                                                                                                                                                   
                                            *                 2 0                   *                 4 0                   *                 6 0                   *                 8 0          
N R 4 A 1 _ H U M A   :   G R C A V C G D N A S C Q H Y G V R T C E G C K G F F K R T V Q K N A K - - Y I C L A N K D - - C P V D K R R R N R C Q F C R F Q K C L A V G M V K E V V R T D   :   7 6
N H R 6 _ C A E E L   :   K M C A V C N D R A V C L H Y G A R T C E G C K G F F K R T V Q K N S K - - Y T C A G N K T - - C P I D K R Y R S R C Q Y C R Y Q K C L E V G M V K E I V R H G   :   7 6
S T F 1 _ B O V I N   :   E L C P V C G D K V S G Y H Y G L L T C E S C K G F F K R T V Q N N K H - - Y T C T E S Q S - - C K I D K T Q R K R C P F C R F Q K C L T V G M R L E A V R A D   :   7 6
E S R 1 _ C H I C K   :   R Y C A V C N D Y A S G Y H Y G V W S C E G C K A F F K R S I Q G H N D - - Y M C P A T N Q - - C T I D K N R R K S C Q A C R L R K C Y E V G M M K G G I R K D   :   7 6
E R R 1 _ H U M A N   :   R L C L V C G D V A S G Y H Y G V A S C E A C K A F F K R T I Q G S I E - - Y S C P A S N E - - C E I T K R R R K A C Q A C R F T K C L R V G M L K E G V R L D   :   7 6
R A R A _ H U M A N   :   K P C F V C Q D K S S G Y H Y G V S A C E G C K G F F R R S I Q K N M V - - Y T C H R D K N - - C I I N K V T R N R C Q Y C R L Q K C F E V G M S K E S V R N D   :   7 6
N R 1 D 1 _ H U M A   :   L L C K V C G D V A S G F H Y G V H A C E G C K G F F R R S I Q Q N I Q - Y K R C L K N E N - - C S I V R I N R N R C Q Q C R F K K C L S V G M S R D A V R F G   :   7 7
E 7 5 B C _ D R O M   :   V L C R V C G D K A S G F H Y G V H S C E G C K G F F R R S I Q Q K I Q - Y R P C T K N Q Q - - C S I L R I N R N R C Q Y C R L K K C I A V G M S R D A V R F G   :   7 7
E 7 8 C _ D R O M E   :   V P C K V C G D K A S G Y H Y G V T S C E G C K G F F R R S I Q K Q I E - - Y R C L R D G K - - C L V I R L N R N R C Q Y C R F K K C L S A G M S R D S V R Y G   :   7 6
C N R 1 4 _ C A E E   :   S F C K V C G D K A S G Y H Y G V T S C E G C K G F F R R S I Q R K I D - - Y R C L K Q Q V - - C E I K R E S R N R C Q Y C R F K K C L D S G M S K D S V R Q M   :   7 6
N H R 2 3 _ C A E E   :   I P C K V C G D K S S G V H Y G V I T C E G C K G F F R R S Q S S I V N - - Y Q C P R Q K N - - C V V D R V N R N R C Q Y C R L K K C I E L G M S R D A V K F G   :   7 6
R O R A _ H U M A N   :   I P C K I C G D K S S G I H Y G V I T C E G C K G F F R R S Q Q S N A T - - Y S C P R Q K N - - C L I D R T S R N R C Q H C R L Q K C L A V G M S R D A V K F G   :   7 6
P P A R A _ H U M A   :   I E C R I C G D K A S G Y H Y G V H A C E G C K G F F R R T I R L K L V - Y D K C D R S - - - - C K I Q K K N R N K C Q Y C R F H K C L S V G M S H N A I R F G   :   7 5
7 U P 1 _ D R O M E   :   I E C V V C G D K S S G K H Y G Q F T C E G C K S F F K R S V R R N L T - - Y S C R G S R N - - C P I D Q H H R N Q C Q Y C R L K K C L K M G M R R E A V Q R G   :   7 6
E A R 2 _ H U M A N   :   V D C V V C G D K S S G K H Y G V F T C E G C K S F F K R S I R R N L S - - Y T C R S N R D - - C Q I D Q H H R N Q C Q Y C R L K K C F R V G M R K E A V Q R G   :   7 6
T R 2 _ H U M A N /   :   D L C V V C G D K A S G R H Y G A V T C E G C K G F F K R S I R K N L V - - Y S C R G S K D - - C I I N K H H R N R C Q Y C R L Q R C I A F G M K Q D S V Q C E   :   7 6
R X R G _ C H I C K   :   H I C A I C G D R S S G K H Y G V Y S C E G C K G F F K R T I R K D L I - - Y T C R D N K D - - C L I D K R Q R N R C Q Y C R Y Q K C L A M G M K R E A V Q E E   :   7 6
H N F 4 A _ H U M A   :   A L C A I C G D R A T G K H Y G A S S C D G C K G F F R R S V R K N H M - - Y S C R F S R Q - - C V V D K D K R N Q C R Y C R L K K C F R A G M K K E A V Q N E   :   7 6
T L L _ D R O M E /   :   V P C K V C R D H S S G K H Y G I Y A C D G C A G F F K R S I R R S R Q - - Y V C K S Q K Q G L C V V D K T H R N Q C R A C R L R K C F E V G M N K D A V Q H E   :   7 8
E R B A _ A V I E R   :   E Q C V V C G D K A T G Y H Y R C I T C E G C K S F F R R T I Q K N L H P T Y S C T Y D G C - - C V I D K I T R N Q C Q L C R F K K C I S V G M A M D L V L D D   :   7 8
E C R _ D R O M E /   :   E L C L V C G D R A S G Y H Y N A L T C E G C K G F F R R S V T K S A V - - Y C C K F G R A - - C E M D M Y M R R K C Q E C R L K K C L A V G M R P E C V V P E   :   7 6
V D R _ H U M A N /   :   R I C G V C G D R A T G F H F N A M T C E G C K G F F R R S M K R K A L - - F T C P F N G D - - C R I T K D N R R H C Q A C R L K R C V D I G M M K E F I L T D   :   7 6
N H R 1 0 _ C A E E   :   E V C L V C S D I S T G Y H Y G V P S C N G C K T F F R R T I M K N Q T - - F S C Q F Q G K - - C P V D K S I R C A C R H C R F E K C L Q V G M D R N A I Q Q N   :   7 6
K N I R _ D R O M E   :   Q T C K V C G E P A A G F H F G A F T C E G C K S F F G R - S Y N N I S T I S E C K N E G K - - C I I D K K N R T T C K A C R L R K C Y N V G M S K G G S R Y G   :   7 7
E G O N _ D R O M E   :   Q L C K V C G E P A A G F H F G A F T C E G C K S F F G R T Y N N I A A - I A G C K H N G D - - C V I N K K N R T A C K A C R L R K C L L V G M S K S G S R Y G   :   7 7
A N D R _ H U M A N   :   K T C L I C G D E A S G C H Y G A L T C G S C K V F F K R A A E G K Q K - - Y L C A S R N D - - C T I D K F R R K N C P S C R L R K C Y E A G M T L G A R K L K   :   7 6
G C R _ H U M A N /   :   K L C L V C S D E A S G C H Y G V L T C G S C K V F F K R A V E G Q H N - - Y L C A G R N D - - C I I D K I R R K N C P A C R Y R K C L Q A G M N L E A R K T K   :   7 6
                              C   6 C               H 5         C     C     F F   R                       C               C   6         R     C     C R     4 C       G M                          
Высчитав по координатам, выяснилось, что выбранный мною гистидин действительно является консервативным.

Далее с помощью программы nucplot нужно было изучить связи между белком и ДНК. Ниже приведен результат:
Отсюда видно, что имеется всего 5 водородных связей и 8 непосредственных контактов. Эти данные сильно расходятся с данными таблицы, возможно из-за разницы методов поиска.


©Попенко Анна