Учебная страница курса биоинформатики,
год поступления 2009

Гомологичное моделирование комплекса белка с лигандом

Отчёт по заданию должен появиться на сайте к следующему занятию.
Отчёт должен содержать все файлы необходимы для моделирования и описание их получения.
Необходимо представить в отчёте результаты моделирования и результаты проверки качества структур.
Необходимо представить обсуждение результата.

Традиционные ссылки на полезные ресурсы:

Уроки по работе с Modeller находятся здесь.
Напоминание о Python от Александра Гришина.
Подсказки.

Вся работа по расчётам будет проходить на kodomo через терминал putty.
Цель данного занятия ознакомится с возможностями гомологичного моделирования комплекса белка с лигандом. В этом занятии мы будем пользоваться пакетом Modeller. Это программное обеспечение распространяется бесплатно для академических пользователей.

Вы будете работать с белком лизоцимом из указанного организма. Используя известную структуру лизоцима форели как образец, Вам необходимо построить модель комплекса Вашего белка с лигандом.

Программе MODELLER для моделирования структуры белков, в качестве входных данных нужны: управляющий скрипт, файл pdb со структурой-образцом, файл выравнивания с дополнительной информацией.

Постройте выравнивание последовательности из структуры ID: 1lmp и предложенного Вам белка. Рекомендуемые ресурсы и программы: Clustal и GeneDoc Полученное выравнивание сохраните в формате PIR.
Модификация файла выравнивания:

Переименуйте последовательность в файле выравнивания как в примере:

Было	Стало
>P1;uniprot\|P37712\|LYSC_CAMDR	>P1;seq
>P1;1LMP\|PDBID\|CHAIN\|SEQUENCE	>P1;1lmp

После имени последовательности моделируемого белка добавьте строчку:

   1 sequence:ХХХХХ::::::: 0.00: 0.00

эта строчка описывает входные параметры последовательности для modeller. После имени последовательности белка-образца добавьте:

   1 structureX:1lmp_now.ent:1 :A: 132 :A:undefined:undefined:-1.00:-1.00

эта строчка описывает, какой файл содержит структуру белка с этой последовательностью, номера первой и последней аминокислот в структуре, идентификатор цепи и т.д. В конце каждой последовательности добавьте символы

   1 /.

Символ "/" означает конец цепи белка. Точка указывает на то, что имеется один лиганд (если бы было два лиганда стояли бы две точки).

Модификация файла со структурой: удалите всю воду из структуры (в текстовом редакторе) всем атомам лиганда присвойте один и тот же номер "остатка" (MODELLER считает, что один лиганд = один остаток) и модифицируйте имена атомов каждого остатка, добавив в конец буквы A, B, C. Смысл операции в том, что атомы остатка 130 имели индекс А, атомы остатка 131 имели индекс В и т.д. . После модификации имен атомов измените номера остатков на 130.

Пример:

Было	Стало
HETATM 1014 O7 NAG 130	HETATM 1014 O7A NAG 130
HETATM 1015 C1 NAG 131	HETATM 1015 C1B NAG 130

сохраните в файле 1lmp_now.ent

Создание управляющего скрипта my_seq.py (my_seq - имя Вашей последовательности, например, lysc_chram)

Вам представляется следующая заготовка:

   1 from modeller.automodel import *
   2 class mymodel(automodel):
   3     def special_restraints(self, aln):
   4         rsr = self.restraints
   5         for ids in (('OD1:98:A', 'O6A:131:A'),
   6                     ('N:65:A', 'O7B:132:A'),
   7                     ('OD2:73:A', 'O1C:133:A')):
   8                     atoms = [self.atoms[i] for i in ids]
   9                     rsr.add(forms.upper_bound(group=physical.upper_distance,
  10                       feature=features.distance(*atoms), mean=3.5, stdev=0.1)) 
  11 env = environ()
  12 env.io.hetatm = True
  13 a = mymodel(env, alnfile='test1.ali', knowns=('1lmp'), sequence='seq')
  14 a.starting_model = 1
  15 a.ending_model = 5
  16 a.make()

В скрипте указано:

что нужно использовать стандартные валентные углы в полипептидной цепи (строчка 4)
что дополнительно нужно сохранять взаимное расположение определенных пар атомов (3.5 ангстрема);
В данном случае трех атомов белка, образующих водородные связи с тремя атомами лиганда - строчки 5-7 с ID пар атомов; параметры взаимного расположения атомов пары описаны в строчке 9-10. 3 точки могут однозначно расположить сложную структуру в пространстве, поэтому мы выбираем водородные связи как источник данных точек.
что ковалентные связи в гетероатомах нужно вычислять по расстояниям между атомами (так же, как это делает Rasmol), строчка 12
что имя файла с выравниванием и имена последовательностей образца и моделируемого белка, строчка 13 (а имя файла со структурой содержится в выравнивании)
что число и номера моделей, которые нужно построить (в данном примере 5 моделей), строки 14-15
что пора строить модель, строчка 16

В скрипте Вам необходимо отредактировать строчки, в которых указаны какие водородные связи белка с лигандом должны быть В БУДУЩЕЙ МОДЕЛИ. Номера остатков и имена нужных атомов определите по выравниванию и тому, какие водородные связи имеются в образце. Критерий водородной связи: расстояние менее 3.5 ангстрем между азотом или кислородом белка с подходящими атомами лиганда.

Если в моделируемом белке число остатков не совпадает с числом остатков в белке-образце, то номера "остатков" лиганда изменятся.

ВНИМАНИЕ. В скриптовом языке (на основе python ) важно с какого столбца начинается информация. Соблюдайте предложенный в заготовке синтаксис.

Запустите исполнение скрипта командой

   1  mod9v8 myscript &

Просмотрите полученные Вами моделибВизуальные различия занесите в отчёт.
Проверьте качество моделей и выберите лучшую. Инструменты для оценки качества структуры можно найти в веб интерфейсе WHATIF (google://whatif). Достаточно 2-3 инструментов. Выберете лучшую модель.

Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2009

Гомологичное моделирование комплекса белка с лигандом

Традиционные ссылки на полезные ресурсы:

Kodomo

Пользователь

Учебная страница курса биоинформатики, год поступления 2009

Гомологичное моделирование комплекса белка с лигандом

Традиционные ссылки на полезные ресурсы:

Учебная страница курса биоинформатики,
год поступления 2009