tRNA structure

На главную страницу третьего семестра

Структура тРНК

  1. Общие сведения
  2. Последовательность тРНК
  3. Данную информацию мы извлекаем из поля SEQRES.
    Нуклеотидная последовательность глутаминовой тРНК:
    U G G G G U A U C G C C A A G C G G U A A G G C A C
    C G G A U U C U G A U U C C G G C A U U C C G A G G
    U U C G A A U C C U C G U A C C C C A G C C A      
    
    В состав данной тРНК не входят модифицированные основания.
    Хотя в ассоциации со структурой белка находятся 5 гетеромолекул 2-х видов: одна 5'-O-[N-(L-GLUTAMINYL)-SULFAMOYL]ADENOSINE и 4 сульфат-иона:
    QSI    998
    SO4   1393
    SO4   1394
    SO4   1395
    SO4   1396
     
    QSI 5'-O-[N-(L-GLUTAMINYL)-SULFAMOYL]ADENOSINE
    SO4 SULFATE ION                               
    
    Нумерация структуры была исследована с помощью файла, полученного командой
    grep 'ATOM.*P.*P' 1qtq.pdb > num.txt
    Нумерация идет с 902 (у 902 нуклеотида не описан атом P) по 976 нуклеотид, но оснований 75, значит какой-то нуклеотид пропущен, и это 917-й.

  4. Программа find_pair
  5. Используя команду
    find_pair -t 1qtq.pdb stdout | analyze получили несколько различных файлов из которых можно извлечь интересующую нас информацию. В частности файл col_helices.scr является скриптом по раскрашиванию различных спиралей. Всего у нашей структуры тРНК оказалось 3 спирали, причем что интересно, третья спираль состояла только из одной пары нуклеотидов (они по всей видимости имеют структуру взаимодействия спиральной формы). Цветовая дифференцировка спиралей еа последовательности тРНК:

    UGGGGU AU CGCCAA GC G G UAA GGCACCGGAUU CUG AUUCCGGCA UU C CGAGG U U CG A AU CCUCGUACCCC AGCCA

    Для большей наглядности ниже приведен рисунок, полученный путем подставления в исследуемый файл pdb скрипта col_helices.scr:

    Однако же то, что у нас получилось, вызывает некоторое несоответствие с представлением о структуре тРНК. Как хорошо известно тРНК имеет форму клеверного листа, иными словами у нее должно бы быть 4 спирали. На деле же мы получаем 2 взаимно перпендикулярных спирали. Изучив более подробно выход программы find_pair мы приходим к выводу, что 2 взаимноперпендикулярных спирали получаются путем сворачивания "четырехспиральной" структуры в третичную форму.

  6. Визуальное исследование с помощью прораммы RasMol
  7. Ниже представлен остов молекулы тРНК с обозначенными концевыми нуклеотидами. Цепи раскрашены по программе find_pair.

    Оранжевый цвет отображает участки, не состоящие в цепях.
    Скрипт, с помощью которого была получена картинка выше.

  8. Взаимодействие нуклеотидов
  9. В структуре исследуемой тРНК имеются примеры внеспирального стэкинг-взаимодействия. Они приведены ниже:
    Шариками на рисунках обозначены атомы, непосредственно участвующие в образовании стэкинг взаимодействия между основаниями (то есть, когда расстояние между атомами из противоположных оснований составляет не более 3.5 ангстрем).
    Информацию по водородным связям между основаниями можно просмотреть в одном из файлов выдачи программы find_pair:
    RMSD of the bases (----- for WC bp, + for isolated bp, x for helix change)
    
                Strand I                    Strand II          Helix
       1   (0.005) B:.902_:[..G]G-----C[..C]:.971_:B (0.004)     |
       2   (0.007) B:.903_:[..G]G-----C[..C]:.970_:B (0.005)     |
       3   (0.009) B:.904_:[..G]G-----C[..C]:.969_:B (0.003)     |
       4   (0.003) B:.905_:[..G]G-----C[..C]:.968_:B (0.005)     |
       5   (0.006) B:.906_:[..U]U-----A[..A]:.967_:B (0.004)     |
       6   (0.004) B:.907_:[..A]Ax----U[..U]:.966_:B (0.002)     |
       7   (0.002) B:.949_:[..C]C-----G[..G]:.965_:B (0.003)     |
       8   (0.003) B:.950_:[..G]G-----C[..C]:.964_:B (0.003)     |
       9   (0.003) B:.951_:[..A]A-----U[..U]:.963_:B (0.002)     |
      10   (0.008) B:.952_:[..G]G-----C[..C]:.962_:B (0.003)     |
      11   (0.004) B:.953_:[..G]G----xC[..C]:.961_:B (0.004)     |
      12   (0.002) B:.954_:[..U]U-**-xA[..A]:.958_:B (0.004)     |
      13   (0.004) B:.955_:[..U]Ux**+xG[..G]:.918_:B (0.013)     x
      14   (0.002) B:.937_:[..A]A-*---U[..U]:.933_:B (0.004)     |
      15   (0.006) B:.938_:[..U]U-*---U[..U]:.932_:B (0.004)     |
      16   (0.003) B:.939_:[..U]U-----A[..A]:.931_:B (0.004)     |
      17   (0.006) B:.940_:[..C]C-*---G[..G]:.930_:B (0.010)     |
      18   (0.006) B:.941_:[..C]C-----G[..G]:.929_:B (0.003)     |
      19   (0.007) B:.942_:[..G]G-----C[..C]:.928_:B (0.003)     |
      20   (0.006) B:.943_:[..G]G-----C[..C]:.927_:B (0.004)     |
      21   (0.005) B:.944_:[..C]Cx*---A[..A]:.926_:B (0.009)     |
      22   (0.005) B:.910_:[..G]G-----C[..C]:.925_:B (0.003)     |
      23   (0.006) B:.911_:[..C]C-----G[..G]:.924_:B (0.008)     |
      24   (0.008) B:.912_:[..C]C----xG[..G]:.923_:B (0.005)     |
      25   (0.003) B:.913_:[..A]A-**+xA[..A]:.945_:B (0.005)     |
      26   (0.004) B:.914_:[..A]A-**-xU[..U]:.908_:B (0.009)     |
      27   (0.020) B:.915_:[..G]Gx**+xC[..C]:.948_:B (0.003)     x
      28   (0.008) B:.919_:[..G]G-----C[..C]:.956_:B (0.003)     +
    
    Там же указано количество неканонических пар оснований: 9. Их можно просто посчитать также в таблице выше - там они обозначаются наличием звездочки <*> между основаниями, например, U-**-xA. Причем количество звездочек по все видимости обозначает количество водородных связей между парой.
    Ниже представлены результаты визуального исследования структуры с помощью программы RasMol (показаны некоторые пары из тех, что помечены звездочкой в таблице выше):
    Принадлежность к А или В форме спирали можно выявить по торсионным углам.
    *Таблица значений конформационно важных торсионых углов:
    Угол α β γ δ ε ζ χ
    A-форма -51.7 174.8 41.7 79.1 -147.8 -75.1 -157.2
    B-форма -29.9 136.3 31.2 143.3 -140.8 -160.5 -98.0

    А теперь сравним их с торсионными углами исследуемой тРНК:
    Strand I
      base    alpha    beta   gamma   delta  epsilon   zeta    chi
       1 G     ---     ---   -176.7    86.5  -135.0   -75.5   176.3
       2 G    -80.2   177.0    60.7    82.4  -159.9   -71.4  -167.4
       3 G    -47.6   172.5    47.1    82.9  -157.8   -61.2  -162.7
       4 G    163.0   177.5   174.7    83.7  -143.5   -72.1  -171.5
       5 U    -59.2   179.0    48.6    82.3  -175.7   -62.0  -158.1
       6 A   -172.2  -178.4   172.6   145.4    ---     ---   -143.3
       7 C     ---    171.9    49.0    86.8  -147.8   -70.9  -169.6
       8 G    -60.2  -179.7    46.1    81.7  -158.2   -68.3  -156.6
       9 A    -63.9  -178.5    46.4    83.4  -169.2   -77.6  -150.6
      10 G    158.1  -165.5   167.8    82.7  -135.7   -69.0  -176.0
      11 G    -53.8   174.4    50.0    81.6  -157.8   -66.7  -170.0
      12 U    -61.8  -175.8    51.6    84.5  -144.5   -66.7  -159.3
      13 U    -72.5   178.4    51.4    85.5    ---     ---   -148.9
      14 A     ---   -164.8    48.3    83.3  -148.3   -57.1  -173.6
      15 U    -62.6  -179.0    52.5    83.7  -140.3   -65.6  -174.8
      16 U    -60.7   168.5    52.5    86.6  -153.0   -57.4  -155.8
      17 C    -62.1   171.2    55.1    86.8  -110.9  -147.9  -175.0
      18 C    116.1  -118.6   167.3    83.8  -137.2   -72.2  -174.8
      19 G    -62.4   172.1    44.6    79.5  -148.6   -76.9  -175.6
      20 G    -54.8   179.5    51.9    82.4  -157.3   -62.5  -156.4
      21 C    -64.7  -178.5    48.7    83.5    ---     ---   -143.8
      22 G     ---    177.5    55.3    89.4  -149.1   -70.1   179.9
      23 C    -68.8  -172.2    48.7    84.5  -160.2   -68.1  -158.6
      24 C    149.6  -173.8   179.0    84.8  -136.7   -59.2  -171.1
      25 A    -52.3   172.5    49.6    82.9   179.8   -79.0  -155.8
      26 A    172.2  -178.1   171.9    88.4  -125.5   -52.4  -174.9
      27 G    -45.7   169.2    46.0   146.2    ---     ---   -114.2
      28 G     ---    159.6    58.3   145.9    ---     ---    -94.0
    
    Strand II
      base    alpha    beta   gamma   delta  epsilon   zeta    chi
       1 C    -61.2   177.3    50.1    84.3    ---     ---   -151.8
       2 C    -70.3  -176.9    51.7    84.2  -151.7   -77.8  -161.7
       3 C    -69.2  -179.2    51.8    83.0  -153.5   -75.4  -164.0
       4 C    -60.7   165.7    56.1    84.1  -159.0   -71.7  -149.0
       5 A    -60.8   178.4    48.3    84.9  -151.4   -75.2  -150.3
       6 U    -56.5   167.5    50.2    82.9  -153.1   -80.2  -169.0
       7 G    150.7  -162.9   175.3    84.0  -136.3   -78.3   177.8
       8 C    -48.3   159.5    51.8    84.5  -165.1   -70.1  -155.8
       9 U    -64.2  -178.5    45.7    83.0  -154.1   -83.7  -159.4
      10 C    -62.5  -178.1    48.4    85.9  -151.6   -76.6  -166.3
      11 C     ---   -175.3    42.9    81.5  -152.2   -75.0  -171.7
      12 A     ---   -130.5    58.6   149.4    ---     ---    -76.8
      13 G     ---   -145.1   -53.6   145.9    ---     ---   -104.0
      14 U    -63.7   172.2    48.4    83.2    ---     ---   -156.2
      15 U    158.2  -155.3   172.9    84.7  -123.6   -70.2   174.2
      16 A    -58.3  -169.9    45.8    81.8  -158.3   -82.8  -156.5
      17 G    -66.9   166.0    50.1    82.1  -164.0   -72.3  -172.9
      18 G    164.1  -169.6   167.5    85.2  -124.8   -82.7   176.6
      19 C    -69.0  -166.8    46.1    82.9  -165.3   -73.1  -155.5
      20 C    -57.1   169.9    50.3    81.3  -154.5   -69.0  -166.7
      21 A    -61.6   176.0    51.7    80.3  -150.7   -71.1  -166.5
      22 C    -59.3   167.9    50.1    81.4  -137.7   -60.7  -163.4
      23 G    -59.8   175.2    53.2    83.1  -146.1   -77.1  -170.4
      24 G     ---    161.8    50.5    81.9  -151.6   -75.8  -176.4
      25 A     ---   -160.0    62.0    86.6    ---     ---   -102.8
      26 U     ---   -152.4    53.6    80.7    ---     ---   -160.0
      27 C     ---    142.1    36.4   141.0    ---     ---   -151.3
      28 C     ---    150.6    49.7    83.7    ---     ---   -170.3
    
    Видно, что в подавляющем большинстве случаев значения торсионных углов приближаются к значениям т.у. А-формы спирали.
    Данное изыскание подтверждается следующей таблицей, также содержащейся в выдаче find_pair:
    Classification of each dinucleotide step in a right-handed nucleic acid
    structure: A-like; B-like; TA-like; intermediate of A and B, or other cases
    
        step       Xp      Yp      Zp     XpH     YpH     ZpH    Form
       1 GG/CC   -1.28    8.21    2.64   -4.69    7.61    4.08     A
       2 GG/CC   -1.76    8.01    2.71   -4.98    7.71    3.46     A
       3 GG/CC   -2.27    8.58    1.95   -7.37    7.13    4.97     A
       4 GU/AC   -1.75    8.51    1.98   -5.29    7.93    3.66     A
       5 UA/UA   -1.90    8.49    2.05   -4.77    8.21    2.93     A
       6 AC/GU   -1.85    7.63    3.33   -4.55    7.55    3.50     A
       7 CG/CG   -2.11    8.55    2.41   -6.46    7.92    4.02     A
       8 GA/UC   -1.65    8.42    2.18   -4.32    8.06    3.26     A
       9 AG/CU   -1.96    8.35    2.32   -7.21    7.42    4.45     A
      10 GG/CC   -2.02    7.85    2.89   -5.71    7.17    4.29     A
      11 GU/AC   -0.85    6.92    3.44   -2.08    7.00    3.25
      12 UU/GA    3.53    4.49    0.36    0.65    4.40    1.47
      13 UA/UG    ---     ---     ---     ---     ---     ---     --- 
      14 AU/UU    0.97    6.99    2.84   -1.35    6.91    3.42
      15 UU/AU   -0.22    8.37    2.28   -3.12    7.92    3.41
      16 UC/GA   -2.39    7.96    2.43   -4.44    7.87    2.42
      17 CC/GG   -2.63    7.93    2.56   -7.02    5.87    5.93
      18 CG/CG   -2.08    8.34    2.67   -6.84    7.14    5.05     A
      19 GG/CC   -2.07    8.10    2.48   -7.40    7.12    4.58     A
      20 GC/AC   -1.50    8.63    2.23   -3.93    8.35    3.15     A
      21 CG/CA   -3.66    7.08    3.61   -5.59    6.40    4.59
      22 GC/GC   -1.91    7.97    2.58   -4.26    7.94    2.70     A
      23 CC/GG   -1.65    8.39    2.65   -6.24    8.04    3.54     A
      24 CA/AG   -2.79    6.69    2.74   -6.40    7.06   -1.30
      25 AA/UA    0.15    7.84    4.18    0.18    8.02    3.76
      26 AG/CU    2.26    1.85    1.75    3.31    2.26    1.60
      27 GG/CC    ---     ---     ---     ---     ---     ---     --- 
    
    Здесь комментариев не требуется. Спирали исследуемой тРНК находятся в А-форме.

  10. Программа einverted
  11. Программа позволяет найти инвертированные последовательности в НК. Запускаем ее с помощью команды
    einverted 1qtq.fasta, где 1qtq.fasta - последовательность тРНК.
    Первые результаты появляются у нас при снижении порога до 20 и так и остаются постоянными при дальнейшем снижении.
    GLU: Score 21: 7/7 (100%) matches, 0 gaps
           1 tggggta 7       
             |||||||
          71 accccat 65      
    
    К сожалению, при наборе стандартных параметров и даже с низким порогом поиск ни к чему не привел: мы получили один из участков нашей тРНК, который действительно был определен программой find_pair как спиральный, но не более того.

  12. Программа mfold
  13. Программа mfold служит для предсказания вторичной структуры НК. Чтобы запустить ее потребовалась команда:
    mfold SEQ='1qtq.fasta' P=15
    Итак, при разрешении на отличие выдаваемой структуры по своей вычисленной энергии от оптимального состояния на 15% программа выдает (третье по счету предсказание) классическую структуру "четырехлистника", или "клевера":
    Сравнивания полученный результат с исследованием программы fiber_pair, замечаем, что спиральные участки большей частью соответствуют друг другу. Отличие от оптимально-энергетической структуры на 15% возможно компенсируется ассоциацией НК с белком. Да и далеко не все в живом организмее находится в оптимальном энергетическом состоянии.
    Таким образом, здесь мы получили совсем неплохой результат, программа mfold успешно справилась с поставленной задачей, построив каноническую модель вторичной структуры.


©Куликовский, Алексей