Help_Block1/Term3/2008

Подсказки к заданиями первого блока

Подсказки к заданиям 1-3

Общие

Найти нужный шаблон можно с помощью кнопок Template > Template Window > DNA/RNA Kit.

Пронумеровать атомы можно с помощью кнопки # в режиме Structure.
Щелчок по кнопке откроет меню с возможными вариантами нумерации. Если предложенный по умолчанию вариант разумен, то нажмите кнопку ОК. Затем щелкая по атомам в нужном порядке получите желаемую нумерацию. Стереть номера можно с помощью кнопок Tools->Clear Numbering.

Для выделения атомов и/или связей цветом дважды щелкните по выделенному фрагменту. Двойной щелчок вызывает меню Properties, в котором нужно выбрать цвет и нажать кнопку Apply.

Для сдвига или поворота выделенного фрагмента используйте кнопки Select/Move и Select/Rotate в режиме Structure. При повороте выделенного удобно также использовать инструменты Set Bond Vertically/Horizontally.

Прерывистые линии проще нарисовать в режиме DRAW.

Для создания подписей и/или текста комментария перейдите в режим Draw и щелкните по 3-ей кнопке снизу в левом меню-столбце
К отдельным упражнениям

При выполнении упр.1 обратите внимание на то, какое из соединений - нуклеотид, а какое - нуклеозид, а также на то, что уридин и псевдоуридин встречаются обычно в РНК!

Рекомендуемый порядок действий при выполнении упр.2:
(1) скопируйте на лист в нужном количестве подходящие шаблоны,
(2) соедините остатки фосфорилированных сахаров, выделите их цветом, (см. выше)
(3) подпишите основания,
(4) соедините основания с остовом и надпишите 5' и 3' концы.

Подсказки к заданию 4

Создайте рабочую директорию H:/Term3/Practice2.
Программу Putty (если у кого ссылка на неё ещё не выставлена на Desktop) можно найти с помощью стандартных средств поиска Windows (Start -> Search -> All files and folders). Пароль и login для доступа на машину kodomo-count.cmm.msu.ru те же, что и для входа в ваш домен. Команда ls покажет содержание текущей директории. Команда cd Term3/Practice2 позволит перейти в рабочую директорию.

Для начала работы с программой fiber запустите (в командной строке машины kodomo-count) команду
fiber -h.
Выберите параметры и опции, необходимые для построения ваших структур. Для ввода последовательности ДНК используйте клавиатуру.

Подсказки к заданию 6

Имейте в виду, что большая бороздка не обязательно шире малой (но обязательно глубже). Где какая бороздка, разберитесь визуально.

1. Измерение шага спирали

Изобразите шариками атомы какого-нибудь одного типа (P или C1* или ещё какого-нибудь...), поверните структуру так, чтобы она была видна "с торца" и оставьте в графическом окне только одну из двух цепей. Определив границы витка, измерьте а) расстояние между соответствующими атомами, б) число нуклеотидов, составляющих виток.

2. Измерение ширины большой и малой бороздок

Ширина бороздки определена для конкретного нуклеотида в достаточно регулярной структуре. Это расстояние от атома фосфора данного нуклеотида до некоторого фосфора комплементарной цепи - такого, что расстояние до соседних фосфоров несколько больше.

Подсказки к заданию 7 (работа с 3DNA)

Пакет 3DNA — один из популярных пакетов программ для анализа и простейшего моделирования структур нуклеиновых кислот.
В пакет входят программы для
1) простейшего моделирования структуры нуклеиновых кислот (например, уже знакомая вам по заданию №4 программа fiber);
2) анализа параметров структуры нуклеиновых кислот (программы find_pair и analyze );
3) получения популярных способов изображения структуры нуклеиновых кислот (программы pdb2img, stack2img, rotate_mol );
4) некоторые вспомогательные программы (например, ex_str, вырезающая фрагмент структуры).
Предлагаемая вам версия пакета работает в операционной системе LINUX. Все программы совместимы, т.е. можно написать скрипт, последовательно выполняющий ряд команд, и конвейер (pipe), передающий выходной файл одной программы на вход другой

Запуск любой программы пакета с опцией -h выведет на экран краткое описание программы и подсказку к ней.

Для анализа структур нуклеиновых кислот будем использовать программы find_pair и analyze.
Программа find_pair определяет спаренные основания и положения спиралей в структуре. Синтаксис:

find_pair -t XXXX.pdb XXXX.fp   

(не забудьте об опции -t ,т.к. часто модифицированные нуклеотиды РНК описаны в поле HETATM, а не ATOM!)

Полученные данные необходимы для работы analyze. Можно перенаправить результат работы find_pair на вход программе analyze:

find_pair -t XXXX.pdb stdout | analyze

В результате будет создан ряд файлов с описанием разных параметров структуры, в файле XXXX.out можно найти описание водородных связей, значения всех торсионных углов, ширину малой и большой бороздки....
В файл staking.pdb будут записаны преобразованные координаты всех динуклеотидных пар, их используют для получения общепринятого изображения стекинг-взаимодействий. Для получения такого изображения нужно

в исходном файле PDB определить номера остатков, между которыми предполагаете стекинг-взаимодействие,
найти в файле staking.pdb номер структуры (Section#0008 - это структура №8), описывающей координаты искомых нуклеотидных остатков,
вырезать эту структуру в отдельный файл с помощью команды
```
ex_str -8 stacking.pdb step8.pdb,
```
построить изображение с помощью команды
```
stack2img -cdolt step8.pdb step8.ps
```

Получившийся ps-файл можно непосредственно импортировать в документ Word. Чтобы вставить картинку в HTML-документ, придётся открыть ps-файл ассоциированной программой Ghost и конвертировать картинку в формат PNG или JPEG.

Программа pdb2img даст изображение полной структуры нуклеиновой кислоты, в котором нуклеотиды представлены как блоки. Чтобы выбрать необходимые параметры и опции программы pdb2img, запустите её с опцией -h и внимательно прочитайте выданную подсказку.
Для поворота молекулы можно использовать программу rotate_mol.

Желающие могут почитать подробное описание пакета (в формате postscript).

Подсказки к заданию 8 (поиск ДНК-белковых контактов)

Внимание! Обозначения атомов в в старом и новом формате могут отличаться!! Работайте все время с одним форматом!

К упр.2

В RasMol нет некоторых из предопределенных множеств атомов, необходимых для выполнения задания. Их придется определять с помощью команды define.
Посмотрите, как в тексте файла из PDB названы нужные атомы: атомы остатка сахара, остатка фосфорной кислоты, атомы азотистых оснований.
В новом формате атомы кислорода остатка фосфорной кислоты обозначаются как *.OP1 и *.OP2. Соответственно команда

       define o_in_phosphate *.OP?

определит множество атомов кислорода в остатках фосфорной кислоты. К определениям, использующим знак "?", лучше всегда добавлять "and dna", поскольку в файле могут оказаться лиганды с похожими названиями атомов.
Аналогичным образом определите множества атомов кислорода и углерода в остатках рибозы.
Множества атомов одного азотистого основания, обращенных в сторону большой и малой бороздок, вы определяли в задании 6, упр.1. Остается только объединить ваши результаты с результатами однокурсников для получения предопределенных множеств всех 4-х оснований!
После того, как все необходимые множества определены, с помощью команды select within( <порог расстояния>, <множество>) и элементарных логических операций над множествами определите количество контактов каждого типа и заполните таблицу.

Подсказки к заданию 9 (предсказание вторичной структуры тРНК)

Работа с einverted не должна вызвать затруднений (помните про замечательную опцию -h!).
Если программа не находит (или, по вашему мнению, находит мало) инвертированных повторов, попробуйте уменьшить значение параметра "Minimum score threshold".
Для работы с mfold заведите отдельную директорию, в которую поместите файл, содержащий последовательность РНК в формате Fasta (модифицированные основания замените или наиболее сходными каноническими, или буквой N). Запустите mfold без параметров, чтобы получить подсказку. Обратите внимание, что для mfold параметры задаются иначе, чем для большинства известных вам программ. Например:
```
mfold SEQ=tRNA2.fasta P=15
```
запустит анализ последовательности из файла "tRNA2.fasta" при значении параметра P, равном 15%.
Параметр P - единственный, который Вам имеет смысл менять. Он указывает, на сколько процентов выдаваемое предсказание структуры может отличаться по своей вычисленной энергии от оптимального. Чем больше значение этого параметра, тем больше вариантов предсказания будет выдано.
Сначала запустите mfold, не указывая параметр P. Программа среди прочего выдаст один или несколько файлов с расширением gif - в них изображены предсказания вторичной структуры. Если ни одно из них Вас не устраивает, запускайте mfold снова и снова, придавая P значения 10, 15, 20, etc.
Внимание! Программа mfold очень не любит, когда входной fasta-файл имеет DOS/Windows формат (т.е., когда конец строки обозначен двумя байтами 0D0A). Не забывайте переводить ваши файлы в Unix-формат (<Shift+F2> в редакторе Far).

Подсказки к заданиями первого блока