Структура тРНК


На главную страницу третьего семестра

Порядок работы:

  1. В таблице найден PDB-код. Из банка скачан соответствующий PDB-файл - 1sz1.pdb. Что содержится в этом файле:

    В дальнейшем работа будет вестись с цепью Е.

  2. Определена последовательность тРНК (последовательность цепи Е, соответственно; всего 76 нуклеотидов; 5'-3'):
    G C G G A U U U A 2MG C U C A G H2U H2U G G G A G A G C M2G C C A G A OMC U OMG A A YYG A PSU 5MC U G G A G 7MG U C 5MC U 
    G U G 5MU PSU C G 1MA U C C A C A G A A U U C G C A C C A

    В состав тРНК входят модифицированные основания (выше - выделены жирным шрифтом):
    ОбозначениеНазваниеБрутто-формула
    2MG2N-метилгуанозин-5'-монофосфат2(C11 H16 N5 O8 P1)
    H2U5,6-дигидроуридин-5'-монофосфат4(C9 H15 N2 O9 P1)
    M2GN2-диметилгуанозин-5'-монофосфат2(C12 H18 N5 O8 P1)
    OMCО2'-метилцитидин-5'-монофосфат2(C10 H16 N3 O8 P1)
    OMGО2'-метилгуанозин-5'-монофосфат2(C11 H16 N5 O8 P1)
    YYGмодифицированный гуанозин-5'-фосфат
    (синоним к 4-(3-[5-O-PHOSPHONORIBOFURANOSYL]-4,6-DIMETHYL-8-OXO-4,8-DIHYDRO-3H-1,3,4,5,7A-PENTAAZA-S-INDACEN-YLAMINO-BUTYRIC ACID METHYL ESTER)
    2(C21 H29 N6 O12 P1)
    PSUпсевдоуридин-5'-монофосфат4(C9 H13 N2 O9 P1)
    5MC5-метилцитидин-5'-монофосфат4(C10 H16 N3 O8 P1)
    7MG7N-метил-8-гидрогуанозин-5'-монофосфат2(C11 H18 N5 O8 P1)
    5MU5-метилуридин-5'-монофосфат2(C10 H15 N2 O9 P1)
    1MA6-гидро-1-метиладенозин-5'-монофосфат2(C11 H18 N5 O7 P1)

    Kак пронумерована цепь РНК в PDB-записи: 1ый рибонуклеотид - гуанозин-5'-фосфат - номер 1; последний рибонуклеотид - аденозин-5'-фосфат - номер 76; вставок/пропусков в нумерации нет.

  3. Предварительно создан файл, содержащий только 1 цепь тРНК - цепь Е. Это было выполнено с помощью программы RasMol. Последовательность команд:
    restrict *e
     
    save H:/Term3/Practice8/1sz1_e.pdb
    Cруктура тРНК проанализирована программой find_pair - результаты тут; команда:
    find_pair -t 1sz1_e.pdb 1sz1_e.fp
    В выдаче получается 3 спирали: спираль 1 и спираль 2 (обе - длиной в 14 пар нуклеотидов; в первой - 3 не Уотсон-Криковских взаимодействия; во второй спирали таких взаимодействий 6 штук) и спираль 3 (длина = 1 пара нуклеотидов). Не совсем понятно, что представляет собой 3ья спираль в 1 пару оснований (но к этому вопросу я вернусь при рассмотрении структуры в RasMol)... Был смысл повторить программу find_pair добавив еще одну опцию - опцию -d (для получения отдельных файлов для каждой из спиралей). См. результаты и подробности про каждую из спиралей тут - 1sz1_e_h.fp_0001, 1sz1_e_h.fp_0002, 1sz1_e_h.fp_0003.
    На последовательности тРНК разными цветами отмечены участки, входящие в разные спирали (спираль1, спираль2, спираль3):
    1 * * * * * * * * 10  * * * * *  *  *   * *20 * * * * *  *  * * *30 *  *  *  *  * *  *  *  *  40  * * * * *  *  * *  * 50
     
    G C G G A U U U A 2MG C U C A G H2U H2U G G G A G A G C M2G C C A G A OMC U OMG A A YYG A PSU 5MC U G G A G 7MG U C 5MC U
    51* * * * * * * *60 * * * * * * * * *70 * * * * *76
    G U G 5MU PSU C G 1MA U C C A C A G A A U U C G C A C C A

  4. Cледующий этап - работа в RasMol c 1sz1.pdb: создание картинки в формате GIF, на которой была бы изображена только цепь Е тРНК в остовной модели, найденные спирали покрашены в разные цвета, при атомах фосфора 5'-концевого и 3'-концевого нуклеотидов подписаны номера остатков (на 5'-конце 1ый атом фосфора - атом второго нуклеотида, поэтому вместо "1" законно написана "2"). Тогда последовательность команд выглядит так:
     background white
     wireframe off
     backbone 60
     restrict *e
     color black
     define hel1 1-7:e, 18:e, 49-55:e, 58:e, 61-72:e  
     define hel2 8:e, 10-15:e, 22-33:e, 36:e, 38-44:e, 48:e 
     define hel3 19:e, 56:e
     select hel1
     color orange
     select hel2
     color cyan
     select hel3
     color green
     select *.p and 2:e
     label 2
     select *.p and 76:e
     label 76
     set fontsize 14
     set fontstroke 2
     color labels black
    Затем - поиск наиболее удачного ракурса и экспорт в GIF. Результат (предварительно импортировано в JPEG):

  5. Анализ структуры средствами RasMol (только цепь тРНК, этот файл). Работа проводилась в соответствии c "Указаниями..."
    Результаты/выводы:

  6. Работа с einverted: поиск инвертированных последовательностей в НК [поиск потенциальных двуспиральных участков внутри молекулы на основе созданных выравниваний с определенным весом]. Команда:
    einverted 1sz1_e.fasta

    Параметры приняты по умолчанию, кроме параметра "Minimum score threshold", равного 15. Соответственно, возможные двуспиральные участки:

    SEQUENCE: Score 15: 5/5 (100%) matches, 0 gaps
          12 tcagt 16      
             |||||
          35 agtca 31
    SEQUENCE: Score 15: 5/5 (100%) matches, 0 gaps
          49 ctgtg 53      
             |||||
          65 gacac 61
    Цветовое решение соответствует цветам, использованным в пункте 3 (1ое выравнивание/последовательности - для 2ой цепи; 2ое выравнивание/последовательности - для 1ой цепи).
    Результаты поиска, на мой взгляд, нельзя назвать удачными. Вроде бы и определены участки потенциальных двуспиральных участков, соответствующие 2м спиралям, но, во-первых, их меньше, чем могло бы быть (сравним, сколько участков последовательностей тРНК составляют спирали 1 и 2 - см. п. 3 этого задания; объяснение: при использовании einverted не учитываются модифицированные основания [определено вводимой последовательностью]). Bо-вторых, 1ое выравнивание (т.е. вроде как соответствующее 2ой спирали), оказывается "неверным" - очевидно пространственное несоответствие: программа find_pair для спирали 2 отражает такие двуспиральные участки: Теоретически улучшить результат выдачи можно, если изменить штраф за гэп (т.о. допустить выпетливание). Но в моем случае, если установить штраф за гэп равный 4, качественно результат не изменится ("проблемы" для 2 спирали остаются).

  7. Проанализирoвана последовательность тРНК программой mfold. Для mfold параметры задаются иначе, чем для большинства известных ранее программ; команда выглядит так:
    mfold SEQ=1sz1_e_mf.fasta P=10
    Чем больше значение параметра P, тем больше вариантов предсказания выдается.
    Сначала ,в соответствии с подсказками, в fasta-последовательности модифицированные основания были заменены буквой N (последовательность - см. тут). Как я ни меняла с такой последовательностью значение параметра Р, вторичная структура была явно далека от реальности (ведь комплементарных взаимодействий с N не образуется; далее - пример при Р=10):


    Поэтому эффективнее на вход подавать нуклеотидную последовательность с заменой модифицированных оснований на наиболее сходные канонические. Команда:
    mfold SEQ=1sz1_e_mf_1.fasta 
    В первой же выдаче есть картинка ("вторая из двух") вторичной структуры, максимально близкая к реальности (дальше я изменяла параметр Р, но "эталоном" осталась именно эта вторичная структура: во-первых, минимальна энергия Гиббса; во-вторых, очень даже "приличными" оказались число азотистых оснований в антикодоновой петле (должно быть 7), "удачно" расположение антикодона - GAA - это OMG A A; в-третьих, согласуется с записью в pdb и предсказанием спиральных участков):

    Симпатичный такой "клеверный лист" получился!:-)))

    Программа mfold весьма и весьма полезна. Но для получения приемлимо-разумного результата требует максимум внимания со стороны пользователя.


©NADEZDA TUKHTUBAEVA,2006