Материалы к заданию 8

 
     

 

  1. См. в PDB-файле, поле COMPND.
     
  2. Последовательность – поле SEQRES, модифицированные основания – поля HET и HETNAM. Чтобы узнать нумерацию, лучше всего просмотреть поле ATOM (можно посредством grep оставить только строки, описывающие атомы фосфора). Insertion code находится в 27 позиции строки ATOM (сразу за номером остатка).
     
  3. При запуске find_pair не забудьте об опции -t (нередко модифицированные нуклеотиды РНК описаны в поле HETATM, а не ATOM). Если в PDB-файле имеются структуры нескольких РНК, то, возможно, будет удобнее создать файл, содержащий только нужную цепь (команда "save pdb" в RasMol, или просто в редакторе Far'а), и подать на вход find_pair именно его.

    Пример разметки спиралей цветом:

    U GGGGUA UC GCC AAGCGGUAA GGCACCGGAUU CUG AUUCCGGC AUUC CGAGG UUCGAAU CCUCGUACCCC AGCCA
    
  4. Рекомендуется сначала ограничиться своей цепью РНК (команда restrict) и показать её в остовной модели (wireframe off, backbone 100), затем дать названия каждой из спиралей командами типа
    define helix1 15-17:B,33-35:B
    
    наконец, по очереди выделять каждую спираль и менять им цвет. Перед созданием картинки постарайтесь развернуть изображение так, чтобы все спирали были хорошо видны.
     
  5. Оставьте в графическом окне только основания ("rna and not backbone"). Для поиска водородных связей можно выделить шариками атомы кислорода и азота оснований:
    select (oxygen,nitrogen) and rna and not backbone
    spacefill 200
    
    затем включить режим измерения расстояний (Settings → Pick Distance) и проверять "подозрительные" пары атомов на расстояние меньше порога водородной связи (3,5 ангстрема, например). Внеспиральный стекинг просто поищите глазами.

    Для прояснения вопроса о том, на что больше похожи спирали РНК, воспользуйтесь знаниями и умениями, полученными вами при выполнения упражнений предыдущего занятия.
     

  6. Работа с einverted не должна вызвать затруднений. Если программа не находит (или, по вашему мнению, находит мало) инвертированных повторов, попробуйте уменьшить значение параметра "Minimum score threshold".
     
  7. Для работы с mfold заведите отдельную директорию, в которую поместите файл, содержащий последовательность РНК в формате Fasta (модифицированные основания замените или наиболее сходными каноническими, или буквой N). Запустите mfold без параметров, чтобы получить подсказку. Обратите внимание, что для mfold параметры задаются иначе, чем для большинства известных вам программ. Например:
    mfold SEQ=tRNA2.fasta P=15
    
    запустит анализ последовательности из файла "tRNA2.fasta" при значении параметра P, равном 15%.

    Параметр P – единственный, который Вам имеет смысл менять. Он указывает, на сколько процентов выдаваемое предсказание структуры может отличаться по своей вычисленной энергии от оптимального. Чем больше значение этого параметра, тем больше вариантов предсказания будет выдано.

    Сначала запустите mfold, не указывая параметр P. Программа среди прочего выдаст один или несколько файлов с расширением gif – в них изображены предсказания вторичной структуры. Если ни одно из них Вас не устраивает, запускайте mfold снова и снова, придавая P значения 10, 15, 20, etc.

    Внимание! Программа mfold очень не любит, когда входной fasta-файл имеет DOS/Windows формат (т.е., когда конец строки обозначен двумя байтами 0D0A). Не забывайте переводить ваши файлы в Unix-формат (<Shift+F2> в редакторе Far).