Задание 1 (поиск контактов ДНК-белок в заданной структуре)
Упражнение 1. Скрипт: script.spt.
Упражнение 2. Контакты разного типа в комплексе ДНК-белок (1BDT). Необходимые определения множеств атомов (и заодно скрипт, создаваемый в процессе работы): script_cont.spt
Первое число — количество атомов со стороны ДНК, второе — со стороны белка:
Контакт | Полярные | Неполярные | Всего |
остатки 2'-дезоксирибозы | 2/2 | 39/29 | 41/31 |
остатки фосфорной кислоты | 25/35 | 15/41 | 40/76 |
остатки азотистых оснований со стороны большой бороздки | 17/16 | 35/53 | 52/69 |
остатки азотистых оснований со стороны малой бороздки | — | — | — |
Первое, что бросается в глаза — атомы азотистых оснований, обращенные в сторону малой бороздки, вообще не взаимодействуют с белком. Из полярных взаимодействий доминируют остатки фосфорной кислоты, поскольку находятся снаружи, а вот кислороды дезоксирибозы участия в этом почти не принимают. Велика роль вклада и азотистых оснований со стороны большой бороздки. Неполярные взаимодействия распределены примерно поровну между всеми тремя типами, а всего их заметно больше, чем полярных.
Контакты ДНК-белок выглядят так:
Полярные атомы в ДНК/белке выделены красным/оранжевым, неполярные — серым/белым.
Упражнение 3. Схема контактов, полученная с помощью nucplot
:
(Редкий пример хорошего дизайна в узкоспециализированных научных программах.)
Упражнение 4. Всего больше одного раза (отмечены звездочкой) на карте контактов встречаются: Gln9(B), Gln(C), Phe10(C), Met4(C) — по два контакта, Met4(A) — три, Met4(D) — четыре контакта (c G13, T14 и их предшествующими фосфатами). Сам бы я до этого никак не догадался, честно. Правда, ученые, которые этим занимались, тоже не догадались, чтобы определить точно, им, собственно, и пришлось проводить эксперимент. Картинка:
Чтобы определить остаток, больше всего влияющий на специфичность связывания, сначала был применен метод гадания на кофейной гуще. Когда он ни к чему не привел, пришлось прочитать статью про выданный мне белок, и оказалось, что четыре Phe10, встраиваясь между соседними фосфатными группами и гидрофобно примыкая к сахарам в остове ДНК, как раз и являются самыми важными для распознавания последовательности ДНК. Картинка:
Задание 2
Реальная и предсказанная вторичные структуры тРНК:
Участок структуры | Позиции в структуре (find_pair) | Предсказание einverted | Алгоритм Зукера, первая находка | Алгоритм Зукера, восьмая находка (самая похожая) |
Акцепторный стебель | 1–7/66–72 (7 пар) | 1–8/65-72 (8 пар, 7 реальных канонических) | 1–7/66–72 (7 пар) | 1–7/66–72 (7 пар) |
D-стебель | 10–12/23–25 (3 пары) | не найден | не найден | 10–12/23–25 (3 пары) |
T-стебель | 49–53/61–65 (5 пар) | не найден | 49–53/61–65 (5 пар) | 49–53/61–65 (5 пар) |
Антикодоновый стебель | 26–32/38–44 (7 пар, из них 3 неканонические) | 28–31/39–42 (все 4 канонические пары) | 28–31/39–42 (все 4 канонические пары, несколько лишних до и после) | 27–32/38–43 (6 пар, из них все 4 канонические и 2 неканонические) |
Общее число канонических пар | 19 | 11 | 16 | 19 |
einverted
, несмотря на все усилия заставить его работать нормально, выдавал при любых параметрах только одно выравнивание. Как нетрудно заметить, такой способ позволяет отобразить лишь два стебля: в начале и в конце. В итоге при параметрах по умолчанию и чуть сниженном пороге einverted находил только акцепторный стебель (захватывая дополнительно и восьмую пару, которая, хотя и действительно является комплементарной, в реальности в тРНК расположена далеко и не взаимодействует). Два стебля einverted определил очень точно, но D- и T-стебли потеряны начисто, без единого намека на их присутствие. Плохо.
mfold
на kodomo так и не запустился (он даже не нашелся), указанный веб-сервер мне не очень понравился, поэтому я использовал этот. С первой же попытки получилась структура, довольно близкая к реальной.
Акцепторный стебель и T-стебель указаны безукоризненно, антикодоновый стебель указан в принципе верно (четыре самые главные канонические пары 28–31/39–42 указаны правильно), но и до, и после реального стебля указано чересчур много лишних пар (на самом деле стебель не продолжается так долго ни в ту, ни в другую стороны). D-стеблю не повезло.
При параметре P (максимально допустимое отклонение энергии от минимальной в процентах) по умолчанию (5) было выдано 2 структуры, при повышении P до десяти — 6 структур (две прежних и четыре новые, одна причудливее другой). А вот при P=15 восьмая из девяти выданных структур оказалась практически точным совпадением (мелкие различия — в антикодоновом стебле последняя связь на самом деле не существует, ну и неканоническая пара A26—C44, которую считает наличествующей find_pair
, здесь не указана):
mfold
— молодец.
(Обе картинки были вручную переработоны с целью исправления нумерации атомов: в PDB-файле они пронумерованы по стандартной номенклатуре тРНК, а mfold
, конечно, нумерует остатки подряд.)