Учебный сайт Кирилла Цуканова → Третий семестр

Комплексы ДНК-белок

Задание 1 (поиск контактов ДНК-белок в заданной структуре)

Упражнение 1. Скрипт: script.spt.

Упражнение 2. Контакты разного типа в комплексе ДНК-белок (1BDT). Необходимые определения множеств атомов (и заодно скрипт, создаваемый в процессе работы): script_cont.spt

Первое число — количество атомов со стороны ДНК, второе — со стороны белка:

КонтактПолярныеНеполярныеВсего
остатки 2'-дезоксирибозы2/239/2941/31
остатки фосфорной кислоты25/3515/4140/76
остатки азотистых оснований со стороны большой бороздки17/1635/5352/69
остатки азотистых оснований со стороны малой бороздки

Первое, что бросается в глаза — атомы азотистых оснований, обращенные в сторону малой бороздки, вообще не взаимодействуют с белком. Из полярных взаимодействий доминируют остатки фосфорной кислоты, поскольку находятся снаружи, а вот кислороды дезоксирибозы участия в этом почти не принимают. Велика роль вклада и азотистых оснований со стороны большой бороздки. Неполярные взаимодействия распределены примерно поровну между всеми тремя типами, а всего их заметно больше, чем полярных.

Контакты ДНК-белок выглядят так:

Полярные атомы в ДНК/белке выделены красным/оранжевым, неполярные — серым/белым.

Упражнение 3. Схема контактов, полученная с помощью nucplot:

(Редкий пример хорошего дизайна в узкоспециализированных научных программах.)

Упражнение 4. Всего больше одного раза (отмечены звездочкой) на карте контактов встречаются: Gln9(B), Gln(C), Phe10(C), Met4(C) — по два контакта, Met4(A) — три, Met4(D) — четыре контакта (c G13, T14 и их предшествующими фосфатами). Сам бы я до этого никак не догадался, честно. Правда, ученые, которые этим занимались, тоже не догадались, чтобы определить точно, им, собственно, и пришлось проводить эксперимент. Картинка:

Чтобы определить остаток, больше всего влияющий на специфичность связывания, сначала был применен метод гадания на кофейной гуще. Когда он ни к чему не привел, пришлось прочитать статью про выданный мне белок, и оказалось, что четыре Phe10, встраиваясь между соседними фосфатными группами и гидрофобно примыкая к сахарам в остове ДНК, как раз и являются самыми важными для распознавания последовательности ДНК. Картинка:

Задание 2

Реальная и предсказанная вторичные структуры тРНК:

Участок структурыПозиции в структуре (find_pair)Предсказание einvertedАлгоритм Зукера, первая находкаАлгоритм Зукера, восьмая находка (самая похожая)
Акцепторный стебель1–7/66–72 (7 пар)1–8/65-72 (8 пар, 7 реальных канонических)1–7/66–72 (7 пар)1–7/66–72 (7 пар)
D-стебель10–12/23–25 (3 пары)не найденне найден10–12/23–25 (3 пары)
T-стебель49–53/61–65 (5 пар)не найден49–53/61–65 (5 пар)49–53/61–65 (5 пар)
Антикодоновый стебель26–32/38–44 (7 пар, из них 3 неканонические)28–31/39–42 (все 4 канонические пары)28–31/39–42 (все 4 канонические пары, несколько лишних до и после)27–32/38–43 (6 пар, из них все 4 канонические и 2 неканонические)
Общее число канонических пар19111619

einverted, несмотря на все усилия заставить его работать нормально, выдавал при любых параметрах только одно выравнивание. Как нетрудно заметить, такой способ позволяет отобразить лишь два стебля: в начале и в конце. В итоге при параметрах по умолчанию и чуть сниженном пороге einverted находил только акцепторный стебель (захватывая дополнительно и восьмую пару, которая, хотя и действительно является комплементарной, в реальности в тРНК расположена далеко и не взаимодействует). Два стебля einverted определил очень точно, но D- и T-стебли потеряны начисто, без единого намека на их присутствие. Плохо.

mfold на kodomo так и не запустился (он даже не нашелся), указанный веб-сервер мне не очень понравился, поэтому я использовал этот. С первой же попытки получилась структура, довольно близкая к реальной.

Акцепторный стебель и T-стебель указаны безукоризненно, антикодоновый стебель указан в принципе верно (четыре самые главные канонические пары 28–31/39–42 указаны правильно), но и до, и после реального стебля указано чересчур много лишних пар (на самом деле стебель не продолжается так долго ни в ту, ни в другую стороны). D-стеблю не повезло.

При параметре P (максимально допустимое отклонение энергии от минимальной в процентах) по умолчанию (5) было выдано 2 структуры, при повышении P до десяти — 6 структур (две прежних и четыре новые, одна причудливее другой). А вот при P=15 восьмая из девяти выданных структур оказалась практически точным совпадением (мелкие различия — в антикодоновом стебле последняя связь на самом деле не существует, ну и неканоническая пара A26—C44, которую считает наличествующей find_pair, здесь не указана):

mfold — молодец.

(Обе картинки были вручную переработоны с целью исправления нумерации атомов: в PDB-файле они пронумерованы по стандартной номенклатуре тРНК, а mfold, конечно, нумерует остатки подряд.)