DNA-protein complexes and tRNA

Задание 1.

Поиск ДНК-белковых контактов в заданной структуре

Упражнение 1.

Команды define RasMol задавать множества атомов.

  • Множество атомов кислорода рибозы (set1).
  • Множество атомов кислорода в остатке фосфорной кислоты (set2).
  • Множество атомов азота в азотистых основаниях (set3).
  • Скрипт-файл с определениями этих множеств + cкрипт, дающий последовательное изображение всей структуры, только ДНК в проволочной модели, той же модели, но с выделенными шариками множеством атомов set1, затем set2 и set3.
Тренировочный скрипт
dna
dna
DNA-protein complex 1DC1 in ribbons model Only DNA in wireframe model
dna
dna
Set 1 - all ribose oxygenes Set2 - all phoshpate oxygenes
dna
Set3 - all nitrogenes

Упражнение 2.

Описание ДНК-белковых контактой в заданной структуре.
Сравнение количества контактов разной природы.



Будем считать полярными атомы кислорода и азота, а неполярными атомы углерода, фосфора и серы. Назовем полярным контактом ситуацию, в которой расстояние между полярным атомом белка и полярным атомом ДНК меньше 3.5A. Аналогично, неполярным контактом будем считать пару неполярных атомов на расстоянии меньше 4.5A.

Скрипт для получения данных.

Контакты атомов белка с Полярные Неполярные Всего

остатками 2'-дезоксирибозы

28 86 134
остатками фосфорной кислоты 34 115 149
остатками азотистых оснований со стороны большой бороздки 4 13 17
остатками азотистых оснований со стороны малой бороздки 7 20 27

Преобладают неполярные контакты.

Упражнение 3.

Получение популярной схемы ДНК-белковых контактов с помощью программы nucplot.



Программа nucplot, предназначенная для визуализации контактов между ДНК и белком, запускается на сервере kodomo. Программа работает только со старым форматом PDB. Схема контактов будет представлена в формате Postscript (ps).
	mkdir  ~/Term3/Practice3
	mkdir  ~/Term3/Practice3/1dc1
	cd  ~/Term3/Practice3/1dc1
	nucplot 1dc1_old.pdb
dna

Упражнение 4.

  • Аминокислотный остаток с наибольшим числом указанных на схеме контактов с ДНК - Asn131(A), он образует 4 контакта.
  • Так как белок не образует никаких особенных паттернов, то видимо, для связывания белка с ДНК служат те остатки, которые образуют больше всего контактов (Arg131, His 253), и следовательно, важны для распознавания последовательности ДНК.

На картинках изображены взаимодействия Arg131:A и (G7:C и A8:C). Видно, что а/о образует 4 связи, 3 из которых полярны. Кроме того, показано расположение этих частей в комплексе: они в самом центре (т.к. ДНК в центре), и могут осуществлять свзять комплекса воедино.
his his

Задание 2.

Предсказание вторичной структуры заданной тРНК



Так как сначала было ничего не понятно, пришлось почитать статью.
В ней приведена общая схема вторичной структуры тРНК:
dna dna

Для исследования была выбрана цепь C, представляющая метионил-тРНК с последовательностью:
[1] 5’ CGCGGGG4SUGGAGCAGCCUGGH2UAGCUCGUCGGGOMCUCAUAACCCGAAGAUCGUCGG5MUPSUCAAAUCCGGCCCCCGCAACCA 3’ [76]
Как можно заметить, на 3’-конце есть триплет CCA, к которому присоединяется аминокислота метионин.

В файле 2fmt_old.pdb есть информация о водородные связях:
RMSD of the bases (----- for WC bp, + for isolated bp, x for helix change)

            Strand I                    Strand II          Helix
   1   (0.017) C:...2_:[..G]G-----C[..C]:..71_:C (0.004)     |
   2   (0.006) C:...3_:[..C]C-----G[..G]:..70_:C (0.006)     |
   3   (0.008) C:...4_:[..G]G-----C[..C]:..69_:C (0.005)     |
   4   (0.004) C:...5_:[..G]G-----C[..C]:..68_:C (0.014)     |
   5   (0.009) C:...6_:[..G]G-----C[..C]:..67_:C (0.009)     |
   6   (0.006) C:...7_:[..G]Gx----C[..C]:..66_:C (0.003)     |
   7   (0.005) C:..49_:[..G]G-----C[..C]:..65_:C (0.006)     |
   8   (0.009) C:..50_:[..U]U-*---G[..G]:..64_:C (0.007)     |
   9   (0.006) C:..51_:[..C]C-----G[..G]:..63_:C (0.006)     |
  10   (0.015) C:..52_:[..G]G-----C[..C]:..62_:C (0.002)     |
  11   (0.009) C:..53_:[..G]G----xC[..C]:..61_:C (0.010)     |
  12   (0.013) C:..54_:[5MU]u-**-xA[..A]:..58_:C (0.005)     |
  13   (0.043) C:..55_:[PSU]Px**+xG[..G]:..18_:C (0.007)     x
  14   (0.005) C:..35_:[..A]Ax*---U[..U]:..33_:C (0.005)     |
  15   (0.005) C:..38_:[..A]A-*---c[OMC]:..32_:C (0.009)     |
  16   (0.005) C:..39_:[..C]C-----G[..G]:..31_:C (0.013)     |
  17   (0.006) C:..40_:[..C]C-----G[..G]:..30_:C (0.008)     |
  18   (0.004) C:..41_:[..C]C-----G[..G]:..29_:C (0.006)     |
  19   (0.007) C:..42_:[..G]G-----C[..C]:..28_:C (0.005)     |
  20   (0.004) C:..43_:[..A]A-----U[..U]:..27_:C (0.006)     |
  21   (0.012) C:..44_:[..A]Ax*---G[..G]:..26_:C (0.010)     |
  22   (0.015) C:..10_:[..G]G-----C[..C]:..25_:C (0.007)     |
  23   (0.005) C:..11_:[..A]A-----U[..U]:..24_:C (0.008)     |
  24   (0.007) C:..12_:[..G]G-----C[..C]:..23_:C (0.005)     |
  25   (0.009) C:..13_:[..C]C----xG[..G]:..22_:C (0.004)     |
  26   (0.008) C:..14_:[..A]A-**-xu[4SU]:...8_:C (0.006)     |
  27   (0.007) C:..15_:[..G]Gx**+xC[..C]:..48_:C (0.006)     x
  28   (0.019) C:..19_:[..G]Gx---xC[..C]:..56_:C (0.004)     +
 

Note: This structure contains 17[9] non-Watson-Crick base-pairs.
Здесь показаны взаимодействия не с первого нуклеотида (цитозин), потому что цепь заканчивается аденином, что означает отсутсвие комплементарного взаимодействия.

Стебли

В соответствии с полученными данными, и руководствуясь статьей, можно определить:
  • Акцепторный стебель состоит из участка 2-6 и комплементарного ему участка 67-71 (голубой)
  • Т-стебель – 49-53 и комплементарного ему участка 61-65 (оранжевый)
  • D-стебель – 10-13 и комплементарного ему участка 22-25(фиолетовый)
  • Антикодоновый стебель – 26-30 и комплементарного ему участка 40-44(зеленый)
dna

Упражнение 1.

Предсказание вторичной структуры тРНК путем поиска инвертированных повторов.



Программа einverted из пакета EMBOSS позволяет найти инвертированные участки в нуклеотидных последовательностях. Найдем возможные комплементарные участки в последовательности исследуемой тРНК. Сравним с их описанием, полученным ранее с помощью find_pair.

При параметрах по умолчанию, einverted записывала только пустые файлы. Пришлось поподбирать:
	-gap        [12] Gap penalty              - 12
	-threshold  [50] Minimum score threshold  - 15
	-match      [3] Match score               - 3
	-mismatch   [-4] Mismatch score           - -4
 
 
При таком подборе команда выдавала только один стебель - акцепторный, зато точно (6 из 6), правда со смещением одного нуклеотида (но они были одинаковые).
	-gap        [12] Gap penalty              - 5
	-threshold  [50] Minimum score threshold  - 10
	-match      [3] Match score               - 10
	-mismatch   [-4] Mismatch score           - -1
 
 
При таком подборе команда выдавала только акцепторный стебель определился так же, но еще добавился D-стебель с угаданными 3 из 4 парами (все 3 угаданные - канонические, 4ая не совсем). Так что хорошо.
	-gap        [12] Gap penalty              - 5
	-threshold  [50] Minimum score threshold  - 5
	-match      [3] Match score               - 5
	-mismatch   [-4] Mismatch score           - -1
 
 
При таком подборе команда выдавала не совсем верно акцепторный стебель, добавился D-стебель определился так же, и еще нашелся антикодоновый стебель (3 из 4, 3 из 3 канонических). Так что еще лучше.

Т-стебель никак не искался.

Упражнение 2.

Предсказание вторичной структуры тРНК по алгоритму Зукера.

Программа mfold из пакета EMBOSS реализует алгоритм Зукера. Постарайтесь подобрать параметры для получения предсказания, наиболее близкого к реальной структуре. Использовала web-версию. Даже не изменяя параметров получила почти точную структуру.

rna


Видно, что нуклеотиды стеблей совпадают с полученными через find_pair, но нумерация почему-то смещена на 1.
Участок структуры Позиции в структуре (по результатам find_pair) Результаты предсказания
с помощью einverted
Результаты предсказания по алгоритму Зукера
Акцепторный стебель 5'-2-6-3'
5'-67-71-3'
Всего 6 пар
6 из 6 (все канонические) 6 из 6
D-стебель 5'-10-13-3'
5'-22-25-3'
Всего 4 пары
3 из 4 (все 3 канонические) 4 из 4
T-стебель 5'-49-53-3'
5'-61-65-3'
Всего 5 пар
0 5 из 5
Антикодоновый стебель 5'-40-44-3'
5'-26-30-3'
Всего 5 пар
3 из 5 (все 3 канонические) 5 из 5
Общее число канонических пар нуклеотидов 23 9 23


Наверх