На главную страницу третьего семестра.

Занятие 8. Структура тРНК.



Задание №1. Начальные данные.


Из таблицы был скачан PDB-код моей тРНК. Начальные данные таковы:
  1. PDB-код моей тРНК - 1ser.
  2. В записи тРНК описана структура: TRNA-SER
  3. Oрганизм-источник: Thermus Thermophilus
  4. В файле представлена одна молекула тРНК
  5. Антикодон тРНК: GGA
  6. Количество нуклеотидов в тРНК: 94
  7. ID тРНК: TRN1
  8. Идентификатор цепи тРНК: T
  9. В структуре также имеются следующие макромолекулы: белковая молекула серил-тРНК-синтетаза, из того же организма: Thermus Thermophilus, гомодимер, 421 аминокислотный остаток (а.о.) в одной субъединице,

Задание №2. Описание последовательности Ser-тРНК.


Полная последовательность тРНК приведена ниже:
G   G   A   G   A   G   G   U   G   C   C   C   G
A   G   U   G   G   C DHU   G   A   A   G   G   G
A   C   A   C   G   A   C   U   G   G   A   A   A
U   C   G   U   G   U   A   G   G   G   G   G   G
C   U   U   A   A   A   C   C   U   C   C   C   U
C   G   C   G   G   G   T PSU   C   G   A   A   U
C   C   C   G   C   C   C   U   C   U   C   C   G
C   C   A                                        

Последовательность тРНК очень специфически пронумерована: с 1-16, 18-20, 20А, 20В, 21-47, 47А-47Q, 48-76. Видно, что есть две вставки в нумерации: (20А, 20В) и (47А-47Q). И также делеции: отсутствуют нуклеотид №17 ( хотя на мой взгляд, это лишь ошибка аннотации, так как в целом последовательность непрерывна в данном участке (проверялось непосредственно на модели тРНК)),нет уридина между G(42) и G(43) (вот это уже настоящая делеция). Номер начального нуклеотида - 1; номер последнего - 76. Отмечено, что нуклеотиды 45-47Q составляют длинное вариабельное плечо тРНК (видимо имеется ввиду добавочная петля тРНК). В самой же кристаллической структуре значительные части тРНК пропали из-за определения электронной плотности как беспорядочный участок, поэтому координаты не определены для следующих нуклеотидов: 1-3, 27-41, 47Е-47J, 72-76. Как видно из таблицы, в последовательность входит фактически одно модифицированное основание: DHU - дигидроуридин на 20-ой позиции в первичной структуре. Но также есть и PSU - псевдоуридин на 73-ей позиции, основание которого - псевдоурацил - можно относить не к модифицированным основаниям, а просто как основание, дающее нуклеотид, структурно изомерный обычному нуклеотиду: уридину. Хотя, во многих учебниках относят данный нуклеотид к модифицированным.

Задание №3. Анализ структуры программой find_pair.


Для решения задачи использовалась программа find_pair со следующей командой:

find_pair -t 1SER.pdb 1ser_list


В качастве результатов получено множество файлов, из которых файл 1ser_list подвергался анализу. Для удобства я сделал следующую команду:

find_pair -td 1SER.pdb 1ser_list


Чтобы все данные, относящиеся к каждой отдельной спирали, были представлены в разных файлах. Итак, программа определила в последовательности Ser-tRNA четыре разных спирали. Мне показалось очень удобным репрезентация строения спиралей, предоставляемой программой, поэтому решено было выложить все эти данные в виде таблицы. Каждое описание спирали выглядит так:# №(цифра - номер комплементарной пары в спирали) | T:...№_:[..x]x (идентификатор и номер нуклеотида в последовательности и тип нуклеотида, причем в скобках []представлено название нуклеотида, используемое в файле) --(водородная связь)-- y[..y]:..№_:Т (те же самые данные, что и для Х, но для комплементарного нуклеотида).
Спираль_№1Спираль_№2Спираль_№3Спираль_№4
#    1 | T:...4_:[..G]G-----C[..C]:..69_:T
#    2 | T:...5_:[..A]A-----U[..U]:..68_:T
#    3 | T:...6_:[..G]G-----C[..C]:..67_:T
#    4 | T:...7_:[..G]G-----C[..C]:..66_:T
#    5 | T:..49_:[..G]G-----C[..C]:..65_:T
#    6 | T:..50_:[..C]C-----G[..G]:..64_:T
#    7 | T:..51_:[..G]G-----C[..C]:..63_:T
#    8 | T:..52_:[..G]G-----C[..C]:..62_:T
#    9 | T:..53_:[..G]G-----C[..C]:..61_:T
#   10 | T:..54_:[..T]T-**--A[..A]:..58_:T
#   11 | T:..55_:[PSU]P-**+-G[..G]:..18_:T
#    1 | T:..10_:[..C]C-----G[..G]:..25_:T
#    2 | T:..11_:[..C]C-----G[..G]:..24_:T
#    3 | T:..12_:[..C]C-----G[..G]:..23_:T
#    4 | T:..13_:[..G]G-**--G[..G]:...9_:T
#    5 | T:..14_:[..A]A-**--U[..U]:...8_:T
#    6 | T:..15_:[..G]G-**+-C[..C]:..48_:T
#    1 + T:..19_:[..G]G-----C[..C]:..56_:T 
#    1 | T:..45_:[..A]A-----U[..U]:..47Q:T
#    2 | T:..46_:[..G]G-----C[..C]:..47P:T
#    3 | T:..47_:[..G]G-----C[..C]:..47O:T
#    4 | T:..47A:[..G]G-----C[..C]:..47N:T
#    5 | T:..47B:[..G]G-*---U[..U]:..47M:T
#    6 | T:..47C:[..G]G-----C[..C]:..47L:T
#    7 | T:..47D:[..G]G-----C[..C]:..47K:T

Судя по приведенным данным, видно, получено четыре спирали. Длина первой спирали: 11 н.п.; второй - 6 н.п.; третьей - 1 н.п.; четвертой - 7 н.п. Хотя я несклонен считать, что третья спираль из одной нуклеотидной пары может являться спиралью, так как вполне возможно, что это просто комплементарная пара и довольно крепкая, поэтому есть основания предполагать, что четко идентифицировано три спирали. Так как в молекуле много оснований отсутствует, то конечно возможна потеря многих потенциально возможных спиральных участков. Причина отсутствия многих нуклеотидов - несовершенности рентгеноструктурного эксперимента (эти участки в рентгеноструктурной дифракции выявились как "шум"). Так, например отсутствуют координаты тринуклеотида 5'-CCA-3' на акцепторном корешке. Такие участки на приведенной ниже картинке закрашены синим цветом. В целом разметка последовательности тРНК по спиралям выглядит так (красным выделена первая спираль, зеленым - вторая, синим - третья, оранжевым - четвертая):



Результат на самом деле впечатляет по следующим причинам. Опираясь на многочисленные литературные данные ("Биофизическая химия" Кантор, Шиммел и др.), можно отметить, что некоторые особенности первичной структуры тРНК можно использовать как индикатор особенностей вторичной структуры. Действительно, наличие консервативной последовательности 5'-GTψC-3', фланкируемой двумя пуринами (для Ser-tRNA это два гуанидина) характерно для Тψ-петли в Тψ-шпильке, аналогично дигидроуридин часто располагается в D-петли и редко находится в спирализованном положении (возможно, это связано с тем, что дигидроуридин не может участвовать в стэкинге, так как все углероды в нем насыщены, и нет делокализованной π-системы электронов). Что же предлагает программа? Во-первых, неспирализованный участок, содержащий дигидроуридин - хорошее подтверждение теории о расположении здесь D-петли; неопределенность с нуклеотидами 27-41 говорит о том, что в структуре не установлены почти полностью координаты антикодоновой (АС) шпильки (действительно, антикодон обычно располагается где-то посередине последовательности тРНК, и часто фланкируется с С5'-конца двумя пиримидинами, а с С3'-конца двумя пуринами: такому определению точно подходит олигонуклеотид CUGGAAA, полностью находящийся в неопределенной зоне); последовательность 5'-GTψC-3' расположена с краю спирализованного участка, что довольно подозрительно, хотя последующие нуклеотиды (5'-CGAAU-3') подверждают наличие здесь Tψ-шпильки. Что же получается? Мы имеем три четких и длинных спирализованных участка; первую спираль (красная) с высокой достоверностью можно считать за Тψ-шпильку, вторую спираль (зеленая) - за дигидроуридиновую шпильку; поверим тому, что координаты антикодоновой шпильки не идентифицированы рентгеноструктурным анализом. Тогда что же это за четвертая (покрашена желтым - на картинках, оранжевым - на схеме) спираль? Судя по тому, как эта спираль расположена по отношению к первичной структуре, можно заметить, что ей можно приписать координаты между предполагаемой, но непроявленной на модели, АС-шпильки и Тψ-шпильки. Но в кааноническом виде этот участок соответствует как раз вариабельной петли, которая по размерам очень сильно варьирует, в разных тРНК по-разному. Но, ещё раз смею заметить, что это лишь субъективное наблюдение, основанное на литературных источниках. Также для иллюстрации выше приводимых теоретических выкладок, далее приведены топологии вторичной структуры для канонической (наиболее обычной) модели тРНК и предполагаемой мной топологии вторичной структуры моделиSER-tRNA из файла 1SER.pdb:
Каноническая модель тРНК.
Предположительная, "спекулятивная" модель Ser-tRNA, представленная в файле 1SER.pdb

Задание №4. Создание изображения ser-tRna.


Чтобы создать такую картинку, какая требуется в задании, в Rasmol'e были сделаны следующие операции. Во-первых, замечено, что программа find_pair, кроме оcновного файла 1ser_list, выдает массу разных скрипт-файлов, среди которых есть файл под названием col_helices.scr. Когда он работает, то из структуры tRNA остаются только спиральные участки, покрашенные каждая в свой цвет. Чтобы избежать непроявления неспиральных участков, был создан файл col_helices_2.scr, в который было скопировано содержимое col_helices.scr, но без двух первых строчек, которые оставляют на экране изображение лишь спиралей. Итак, далее последовательность команд в Rasmol'e такова:

restrict rna 
script col_helices_2.scr
backbone 100
wireframe off   # молекула тРНК представлена в тяжевой модели 
select g4.p
color cyan
cpk 400         # первый атом фосфора 4-ого нуклеотида (гуанин g) в шариковой модели, голубого цвета  
pick label
set fontsize 14
set fontstroke 1
label %n %a %r  # в названии указаны: имя нуклеотида (G, C, A, и тд), тип атома (фосфор), номер нуклеотида.  
select c71.p
color magenta
cpk 400         # последний атом фосфора 71-ого нуклеотида (цитидин С) в шариковой модели, розового цвета     
label %n %a %r  # в названии указаны: имя нуклеотида (G, C, A, и тд), тип атома (фосфор), номер нуклеотида.
zoom 150

Итак, картинка следующая:


Очень странный, необычный вид третичной структуры. Принято, что общая третичная структура любой тРНК имеет Г-форму, а в данном случае совершенно не проглядывается Г-формы. Но при более пристальном рассмотрении молекулы можно заметить следующее: во-первых, возвращаясь к определению вставок и делеции, было сделано следующее: на одном изображении молекула была представлена в виде backbone и trace, раскраска по спиралям, как то репрезентируется в скрипте col_helives_2.scr (первая спираль - красный, вторая - зеленый, третья - синий, четвертая - жеплтый) Так вот, замечено, что определенное выпетливание есть в районе 53-55Т, где образуется дигидроуридиновая петля, причем выпетливается (имеется ввиду, что модель в trace-форме [непрерывная цепочка] не накладывается целиком на backbone-форму) как раз псевдоуридин!!, хотя его координаты определены в записи pdb-файла. Также непонятна причина отсутствия в backbone-форме 54-ого нуклеотида, в области тимидилпсевдоуридиновой шпильки, причем отсутсвует как раз тимидин!!, хотя опять же ситуация с координатами в pdb-файле в норме. Поэтому, несовсем понятна причина такого факта. Данную ситуацию можно наблюдать на картинке ниже ("странные" участки покрашены белым, но по каким-то причинам, координаты дигидроуридина не находится Rasmol'ом, поэтому он не покрашен и не назван, но всеже выпетливание заметно):


Но, несмотря на возникнутое недоразумение, можно заметить, что в третичной структуре D-шпилька сильно сближена с Tψ-шпилькой, где контакты поддерживаются третичными взаимодействиями, и тогда, по мною предлагаемой теории, V-петля (вариабельная петля) располагается как раз в области угла "Г-образной" структуры, правда у которой не хватает еще одной шпильки - антикодоновой (АС-шпилька).

Задание №5. Анализ структуры Ser-tRna с помощью Rasmol'a.


Для выяснения о внеспиральном стэкинге и неканонических взаимодействиях между основаниями между основаниями в Rasmol'e было получено следующее изображение модели:


С помощью следующих команд Rasmol'a (несколько модифицированными, чем это предлагается в подсказках):
restrict rna and not backbone
zoom 180
select (oxygen,nitrogen) and rna and not backbone
spacefill 200
select rna and not (oxygen, nitrogen)
script col_helices_2.scr
select (oxygen,nitrogen) and rna and not backbone
color cpk
select rna and not (backbone,oxygen,nitrogen)
wireframe 60   # Итого получено изображение только нуклеотидных оснований с шариковой моделью атомов кислорода и азота,
а углеродный остов этих оснований покрашен в цвета, указывающие на их принадлежность определенным спиралям или/и 
петельным участкам

Итак, общий визуальный анализ:
  1. Внеспиральный стэкинг наблюдается между следующими нуклеотидами (на рисунке углероды этих нуклеотидов изображены белым цветом в wireframe модели): G(42)-G(43)-U(44): ярко выраженная стопка из трех слоев нуклеотидов; стэкинг между U(70)-C(71): стопка из двух нуклеотидов; стэкинг между A(59)-U(60) - сэндвич из двух нуклеотидов; наконец, самое интересное: интеркалярный (вставочный) стэкинг между неспирализованными нуклеотидами и участками спиралей: А(22) вовлечен в межплоскостное взаимодействие с G(23) и A(14), входящими в спираль №2 (зеленого цвета) - сэндвич из трех нуклеотидов G(23)-А(22)-A(14) ; A(21) в стэкинге с G(9) и C(48), входящими в спираль №2 - такой же сэндвич: G(9)-A(21)-C(48); возможно, наблюдается стэкинг между G(20В) - [A(45),U(47)]: двойной сэндвич; возможно образование стопки из трех нуклеотидов: G(19)-G(57)-G(18), где G(19) входит в спираль №1 (красная), а G(18) - вроде образует спираль №4 (впрочем, её существование вызывает подозрения). На мой взгляд, биологический и термодинамический смысл таких интеркалярных стопочных взаимодействий в стабилизации третичной структуры Ser-tRNA и ограничении степеней свободы сахаро-фосфатного остова (вращательный, колебательный моменты), отчего резко возрастают потери в энтропии почти каждого нуклеотидного остатка, задействованного в таких взаимодействиях, но выигрыш возникает из высокоэнергетического этальпийного фактора, который суммируется как из стэкинговых, так и негидрофобных связей. Таким образом, молекула тРНК оказывается очень жесткой, стабильной, плотной ( хотя некоторое увеличение степени свободы, и следовательно ΔG, возможно для участков акцепторного корешка и антикодоновой шпильки, так как они вовлечены во взаимодействия с переносимой аминокислотой и мРНК, а это требует побольше свободной энергии). Для меня молекула тРНК представляется как черчежный угольник, на концах которого шарнирно закреплены блоки, обладающие вращательным, колебательным, угловым моментами.


    Интеркалярный стэкинг - виден сэндвич из двух зеленых (спирализованными) и между ними - белым (неспирализованным) нуклеотидами.
  2. Мною были замечены следующие неканонические взаимодействия в тРНК.1. Неканоническое взаимодействие трех!!! пуринов: G(9):G(13):A(22) (правда, только в такой последовательности). Это взаимодействие реализовано прямо в "узле", где берут начало все три идентифицированные спирали. Схематично взаимодействие выглядит так:


    2. Иной порядок водородных связей в паре G(15):C(48) - реализовано лишь две водородные связи. Донорные атомы: N(1), N(2) гуанина, акцепторы: O(2), N(3) цитозина (я решил называть лишь основания, так как на картинках приведены изображения именно оснований, а не нуклеотидов). Видимо, это связано с тем, что для реализации всех трех потенциально возможных связей, потребовалось бы "перевернуть снизу вверх" одну из молекул (либо G, либо C), то есть изменить настолько сильно конформацию нуклеотида в целом, что произойдут изломы сахарофосфорного остова, ничем не стабилизированные (в отличие от уридиновых изгибов, стабилизируемые U и ψ).


    3. Аналогично выше приведенному примеру, неканоническое взаимодействие, основанное на изменении типа водородных связей (т.е. типа доноров или/и акцепторов Н-связи) реализовано во взаимодействии A(14):U(8). Приэтом, донором водородных связей становятся атомы N(6) аденина,N(3) урацила, а акцепторами стали атомы N(7) аденина и О(2) урацила. Объяснение данному факту такое же, как и для G:C пары примера 2.


    4. Также, понятное дело, что неканоническими взаимодействия будут те, которые осуществляются между ψ, Т (в составе тРНК все-таки!) и другими нуклеотидами. Но, по непонятным мне причинам, ни один из этих нуклеотидов не появился у меня на экране в виде wireframe-модели.
    Чтобы установить, к какому типу относятся спирали тРНК, я сделал следующую операцию в командной строке Unix:

    find_pair 1SER.pdb -t stdout | analyze


    В итоге, в файле 1SER.out в строке с заглавным названием "Classification of each dinucleotide step in a right-handed nucleic acid structure: A-like; B-like; TA-like; intermediate of A and B, or other cases" я выяснил, что все (или почти все) спирализованные нуклеотидные пары образуют А-форму спирали. Этому есть конкретное объяснение: рибоза содержит в C(2') положении массивную ОН-группу, в отличии от ДНК, где у дезоксирибозы в этом положении атом Н. Отчего из-за стерических затруднений и возможных трансаннулярных отталкиваний между 2'ОН-группой и атомом О(5'), предпочтительная конформация рибозы становится С3'-эндо:


    И действительно, по данным файла 1ser.pdb, только для G7, G9, G18, G19, C20, D 20A, G 20B C48, A58, U 60 установлена С2'-эндо конформация рибозы!, а для остальных - С3'-эндо, и это при том, что только для G7, G9, G18, G19, C20 установлено, что они входят в состав двунуклеотидной спиральной структуры, когда у остальных - возможна конформация однонуклеотидной правозакрученной спирали. В результате имеем выгодное расположение оснований в составе нуклеотидов для образовании "исключительных", неканонических взаимодействий (а также и уотсон-криковских пар), жестко закрепляющих, стабилизирующих третичную структуру тРНК. Также сами С3'-OH группы - потенциальные доноры и/или акцепторы Н-связи!!, так что взаимодействия с этими атомами также могут иметь место в третичной структуре тРНК.

    Задание №6. Программа einverted и её результат.


    Для решения предоставленной задачи, были проведены следующие операции: из RCSB-банка была скачана полная последовательность Ser-tRNA. Затем в строке Unix использовалась следующая команда:

    einverted -verbose


    И в дальнейшем, просто отвечал на запросы программы. В результате долгих переборов различных вариантов значений "Gap penalty" и "Minimum score threshold" и проверок на коррелируемость с ранее полученными результатами, я остановился на следующих параметрах работы программы: "Gap penalty=5", "Minimum score threshold=7", остальное по умолчанию. В итоге получена следующая информация:
    SEQUENCE: Score 22: 9/9 (100%) matches, 1 gaps
           1 ggagaggtgc 10                        
             ||||||| ||                           
          90 cctctcc-cg 82                        
    

    Как можно заметить, возможная спираль (только одна) установлена по сути на "акцепторном корешке" тРНК. Действительно, первые нуклеотиды последовательности образуют водородные связи с завершающими нуклеотидами, при чем самые последние четыре свободны от связей: как то полагается для АС-шпильки любой тРНК. Но больше спиральных участков программа не установила. Следовательно, вывод однозначен: для поиска возможных двуспиральных участков в последовательности тРНК использовать данную программу с этими условиями не стоит.

    Задание №7. Программа mfold и её результат.


    Программа mfold для построения вторичной структуры молекулы использует алгоритм минимизации энергии. Итак, файл с полной последовательностью Ser-tRNA был переведен в Unix-формат и затем запушен в программе mfold с помощью следующей команды:

    mfold SEQ=1SER.fasta P=15


    Сперва использовалось значение Р=15, но с шагом "5" оно увеличивалось до 100. Наконец, среди 26-ти предлагавшихся структур, меня не устроило ни одно из предсказаний. Действительно, в двух моделях, более/менее похожих хотя бы на "клеверный лист" тРНК (из которых одна оказалась слабо, но достойной) можно заметить огромное количество фактов, противоречащих со здравым смыслом. Так, в приведенной по ссылке структуре, вроде отлично определена АС-шпилька (как раз семь нуклеотидов в петле - просто супер!!), удовлетворительно найдены координаты D-шпильки (хотя со столь большой петлей я не соглашусь), но что касается до вариабельной(V) петли и следующей за ней Тψ-шпильки, так они определены попросту говоря ужасно: предполагаемое нахождение ψ - в АА(акцепторной)-шпильке, а координаты V-петли вообще попадают на спирализованный участок. Также нужно учесть, что определены структура лишь для участка в 80 нуклеотидов, когда в последовательности 94 остатка. Поэтому, затем я поступил следующим образом: был создан файл с последовательностью, полностью совпадающей со структурной последовательностью (то есть содержит те же делеции, что и в структуре). Так вот, при Р=20, и на восьмом шаге, была получена модель:


    Которая фактически полностью совпадает с приведенной моделью в pdb-файле. Действительно, хорошо определены координаты D-петли, также полностью совпали координаты предполагаемой длинной V-шпильки,охватывающей участки 47-47Q, "на ура" идентифицирована Tψ-петля. В целом, если опять же при хорошем добавлении недостающих остатков, должна быть сформирована еще одна шпилька (АС-шпилька), и тогда будет целая тРНК с длинной V-петлей. Вывод: в целом, программа хорошая (все же выше приведенная структура доказывает это), и метод предсказания вторичной структуры по минимизации потенциальной энергии оправдывает себя, как один из верных способов достижения этого. Но очевидно, что этот метод не идеален, как можно убедиться на результатах поиска по всей последовательности (см. ссылку). И конечно, программой нужно уметь пользоваться, что бы во время предсказания топологии тРНК не получалось вот таких структур



    ©Володя Рудько