Исследование структуры тРНК

1. Краткое описание структуры в файле 1F7V.pdb

В файле приведены координаты атомов Аргинил-тРНК-синтетазы (цепь А), Аргинил-тРНК (цепь В) и молекул воды (44 атома). Комплекс выделен из SACCHAROMYCES CEREVISIAE.

Для исследования была выбрана цепь B, представляющая Аргинил-тРНК со следующей последовательностью:

[901] 5' - UUCCUCGUGGCCCAAUGGUCACGGCGUCUGGCUICGAACCAGAAGAUUCCAGGUUCAAGUCCUG GCGGGGAAGCCA - 3' [973],

где 901 и 973 - номера первого и последнего нуклеотида.

На 3'-конце последовательности в PDB-файле триплет CCA, к которому присоединяется аминокислота, отсутствует.

2. Исследование вторичной структуры

С помощью программы find_pair пакета 3DNA были определены возможные водородные связи между азотистыми основаниями (rna_old.out). В соответствии с полученными данными, акцепторный стебель состоит из участка 901-907 и комплементарного ему участка 966-972:

    (0.043) B:.901_:[PSU]P-*---A[..A]:.972_:B (0.002)
     (0.002) B:.902_:[..U]U-----A[..A]:.971_:B (0.004)
     (0.004) B:.903_:[..C]C-----G[..G]:.970_:B (0.004)
     (0.005) B:.904_:[..C]C-----G[..G]:.969_:B (0.004)
     (0.003) B:.905_:[..U]U-*---G[..G]:.968_:B (0.008)
     (0.003) B:.906_:[..C]C-----G[..G]:.967_:B (0.011)
     (0.004) B:.907_:[..G]Gx----C[..C]:.966_:B (0.004)     

Т-стебель из 949-953 и 961-965:

    (0.013) B:.949_:[5MC]c-----G[..G]:.965_:B (0.005)
     (0.004) B:.950_:[..C]C-----G[..G]:.964_:B (0.007)
     (0.006) B:.951_:[..A]A-----U[..U]:.963_:B (0.005)
     (0.010) B:.952_:[..G]G-----C[..C]:.962_:B (0.006)
     (0.010) B:.953_:[..G]G----xC[..C]:.961_:B (0.004)     

D-стебель из 910-913 и 922-925:

    (0.007) B:.910_:[2MG]g-----C[..C]:.925_:B (0.008)
     (0.003) B:.911_:[..C]C-----G[..G]:.924_:B (0.010)
     (0.004) B:.912_:[..C]C-----G[..G]:.923_:B (0.012)
     (0.010) B:.913_:[..C]C-*--xC[..C]:.922_:B (0.005)     

Антикодоновый стебель из 939-944 и 926-931:

    (0.008) B:.939_:[..C]C-----G[..G]:.931_:B (0.010)
     (0.003) B:.940_:[..C]C-----G[..G]:.930_:B (0.007)
     (0.006) B:.941_:[..A]A-----U[..U]:.929_:B (0.005)
     (0.010) B:.942_:[..G]G-----C[..C]:.928_:B (0.004)
     (0.003) B:.943_:[..A]A-*---P[PSU]:.927_:B (0.044)
     (0.008) B:.944_:[..A]Ax*---g[M2G]:.926_:B (0.013)     

Рис.1. Вторичная структура Аргинил-тРНК из SACCHAROMYCES CEREVISIAE

Акцепторный стебель выделен красным, Т-стебель - зеленым, D-стебель - синим, антикодоновый - оранжевым. В шарнирной модели - антикодон ICG (I-инозин) в антикодоновой петле.


Скрипт для получения изображения:

    zap                          select 910-913, 922-925
     background white             color blue
     load 1f7v-rna.pdb            select 939-944, 926-931
     restrict none                color orange
     select rna                   pause
     backbone 80                  select 934-936 and not backbone
     color gray                   color cpk
     select 901-907, 966-972      select 934-936
     color red                    wireframe 40
     select 949-953, 961-965      spacefill 100
     color green                  pause

Структуру стеблевых дуплексов поддерживают 13 канонических и 9 неканонических пар оснований.

Пример неканонической пары - B:.913_:[..C]C-*--xC[..C]:.922_:B:

Также в тРНК имеются вариабельная петля GADU, D-дигидроуридин (945-948); остаток тимидина в Т-петле (954); 2 дигидроуридина в D-петле (916, 919).

3. Исследование третичной структуры

В файле rna_old.out нахожу данные о величине площади "перекрывания" 2-х последовательных пар азотистых оснований. Пары с наибольшими значениями - большая площадь перекрывания, наиболее вероятное стекинг-взаимодействие:

    step      i1-i2        i1-j2        j1-i2        j1-j2        sum
   7 Gc/GC  5.97( 1.41)  0.00( 0.00)  0.00( 0.00)  7.08( 4.30) 13.05( 5.71)
  12 Gu/aC  7.08( 1.99)  0.00( 0.00)  0.00( 0.00)  4.95( 1.78) 12.03( 3.77)
  13 uP/Ga  5.41( 1.91)  0.00( 0.00)  0.00( 0.00)  7.84( 2.58) 13.25( 4.49)
  21 gC/GC  3.31( 1.06)  0.00( 0.00)  0.00( 0.00)  5.48( 2.49)  8.79( 3.55)

Cтандартные изображения их стекинг-взаимодействия:

Взаимная ориентация для step7 в RasMol:

Пары с небольшим и нулевым значениями:

    step      i1-i2        i1-j2        j1-i2        j1-j2        sum
  20 Ag/Cg  0.00( 0.00)  0.00( 0.00)  1.23( 0.05)  0.28( 0.08)  1.52( 0.13)
  26 AG/CU  0.00( 0.00)  0.00( 0.00)  0.00( 0.00)  0.00( 0.00)  0.00( 0.00)

Cтандартные изображения их стекинг-взаимодействий:

Взаимная ориентация для step20 в RasMol:

Стекинг-взаимодействие между основаниями конца акцепторного стебля и начала Т-стебля - случай step7, расмотренный выше:

Стекинг-взаимодействие между основаниями конца антикодового стебля и начала D-стебля - случай step20, рассмотренный выше:

Дополнительные водородные связи в тРНК, стабилизирующие ее третичную структуру:

   (0.009) B:.954_:[5MU]u-**-xa[1MA]:.958_:B (0.009)
    (0.044) B:.955_:[PSU]Px**+xG[..G]:.917_:B (0.009)
    (0.003) B:.914_:[..A]A-**-xU[..U]:.908_:B (0.004)
    (0.005) B:.915_:[..A]Ax**+xU[..U]:.948_:B (0.006)
    (0.010) B:.918_:[..G]G-----C[..C]:.956_:B (0.003) 

1 каноническая и 4 неканонические пары.

Расположение оснований, образующих водородные связи:

Три пары (каноническая и две неканоничесие) образуются между азотистыми основаниями T- и D-петлей две другие неканонические - между основаниями D-петли и основаниями, расположенными между D-стеблем и акцепторным и T-стеблями.

Пример неканонической пары между основаниями T- и D-петлей:

4. Предсказание вторичной структуры тРНК

Предсказание вторичной структуры тРНК путем поиска инвертированных повторов (с помощью программы einverted из пакета EMBOSS)

Изначально использовала online-версию программы (на kodomo получилось тоже самое). При выполнении работы пришлось заменить инозин на стандартный нуклеотид. Наибольшее число находок при gap penalty=12 возникло при minimum score threshold=15, при больших значениях ничего не появлялось:

SEQUENCE: Score 15: 5/5 (100%) matches, 0 gaps
      27 tctgg 31
         |||||
      43 agacc 39

 SEQUENCE: Score 15: 5/5 (100%) matches, 0 gaps
      49 ccagg 53
         |||||
      65 ggtcc 61

Т.е. наидены D-стебель и антикодоновый. При понижении gap penalty до 0 получаю:

SEQUENCE: Score 72: 24/24 (100%) matches, 23 gaps
       1 tt-cctcgtggcccaatggtcacggcgtctgg---ctgcgaa-c--c 40
         || || |   | || | ||  |   | | | |   ||| ||| |  |
      72 aaggg-g---c-gg-t-cc--t---g-a-a-cttggac-cttagaag 42

Вижу, что огромный минус программы - рассмотрение только канонических взаимодействий.

Предсказание вторичной структуры тРНК по алгоритму Зукера (с помощью программы mfold из пакета EMBOSS)

Использовала online-версию программы. Изменяла параметр P, показывающий на сколько процентов выдаваемое предсказание структуры может отличаться по своей вычисленной энергии от оптимального. Изображение, наиболее соответствующее полученным прежде данным, получилось при P=15:

Таблица. Реальная и предсказанная вторичная структура тРНК из файла 1RIO.pdb

Участок структуры

Позиции в структуре (по результатам find_pair)

Результаты предсказания
с помощью einverted

Результаты предсказания по алгоритму Зукера

Акцепторный стебель

5'-901-907-3'
5'-966-972-3'
Всего 7 пар

предсказано 2 пары из 7 реальных

предсказано 7 пар из 7 реальных

T-стебель

5'-949-953-3'
5'-961-965-3'
Всего 5 пар

предсказано 5 пар из 5 реальных

предсказано 5 пар из 5 реальных

D-стебель

5'-910-913-3'
5'-922-925-3'
Всего 4 пары

нет

предсказано 3 пары из 4 реальных

Антикодоновый стебель

5'-939-944-3'
5'-926-931-3'
Всего 6 пар

предсказано 5 пар из 6 реальных

предсказано 5 пар из 6 реальных

Общее число канонических пар нуклеотидов

13 (9 неканонических)

12

19


© Eugenia Prokhorova 2011