Учебная страница курса биоинформатики,
год поступления 2013
Практикум 3. Белок <сам с собой>: гидрофобные взаимодействия, водородные связи, солевые мостики, дисульфидные мостики. Задания
По этому практикуму проверяется:
- Веб-страница "Внутримолекулярные взаимодействия в структуре белка X (идентификатор PDB ZZZZ)". Рекомендуется эту страницу сделать в виде списка ссылок на другие страницы, по одной на каждый вид взаимодействия (например, страницы "Остовные водородные связи и элементы вторичной структуры"; "Внутримолекулярные взаимодействия боковых цепей - солевые мостики, водородные связи, не являющиеся солевыми мостиками, дисульфидные связи"; "Гидрофобное взаимодействие и гидрофобные кластеры").
- (*) Пополнение веб-страницы практикума 2.
(*) Результат выполнения задания №1, файл XXXXXXX_seq_compare.txt (где XXXXXXX, как обычно, Ваша фамилия) в директории credits.
Красивее, если рисунки будут не на черном, а светлом фоне! Команда background white'. Я обычно использую для фона такой цвет: background [230,240,250]` ААл.
Срок выкладывания результатов на сайт: 23:59 4.03.2014.
(*) Задание №1. Постройте выравнивание последовательности своего белка из 1го семестра и последовательности его же, по данным из PDB-файла
Это задание станет обязательным в блоке "Выравнивание" в конце семестра. Сейчас оно поможет вам идентифицировать ваш белок в структуре в том случае, если в ней присутствует много белков.
Если все и так ясно, то пропустите это задание!
Скачайте последовательности всех цепей в FASTA-формате с сайта PDB и сохраните их в файле ZZZZ.fasta
Зайдите на сайт PDB.
- В строку поиска введите свой идентификатор.
- Щелкните справа вверху на ссылку "Download files" и выберите пункт "FASTA sequences".
Скопируйте в рабочую директорию файл с FASTA-последовательностью своего белка (чтобы не искать его потом долго) из материалов первого семестра.
Создайте файл XXXXXXX_seq_compare.fasta, где XXXXXXX, как обычно, Ваша фамилия, и выложите его в папку credits по завершению работы над ним. В этом файле:
- Скопируйте в него последовательность Вашего белка в FASTA-формате.
- Скопируйте также в него последовательности разных цепей из PDB-файла в FASTA-формате, и оставьте только ту, которая соответствует Вашему белку.
Вариант 1. Сделайте так, чтобы все символы последовательности были на одной строке. Можно воспользоваться своим скриптом из pr6 прошлого семестра
Если нужно, вставьте в начало одной из последовательностей символы "-" (так называемые гэпы), чтобы одна последовательность точно соответствовала другой.
Вариант 2. Откройте fasta-файл с последовательностями в редакторе JalView. Оставьте только две нужные последовательности. Выровняйте их вручную, см. подсказки по JalView как двигать последовательности или их части.
- Откройте выравнивание на странице пр.2 и опишите различия между последовательностями.
Задание №2. Создайте изображение остовных водородных связей:
a) В одной альфа-спирали
Остов α-спирали следует изобразить в проволочной модели. Внимание: остов, т.е. все, кроме боковых цепей, выделяется командой select backbone.
- Для первого и последнего остатков на рисунке должны быть подписаны номера (используйте средства Jmol или графического редактора)
- Можно добавить шариковую модель
- Раскраска - по типу атомов (color cpk)
- См. подсказки как показать остовные водородные связи.
- Все остальное, кроме одной спирали, изобразите очень тонкими линиями в любой модели (или вообще не изображайте). Главное в рисунке - водородные связи, поддерживающие конформацию спирали!
- Опишите типичную водородную связь: кто донор, кто акцептор, как связаны номера остатков, содержащих донора и акцептора.
б) В одном бета-листе, состоящем не менее, чем из трех тяжей
- Аналогично.
- Укажите какие из соседних тяжей параллельны, какие - антипараллельны.
- (*) Описание водородных связей (кто с кем) здесь сложнее. Если справитесь, то будет очень хорошо.
Подсказка. Водородные связи между азотами и кислородами остова в Jmol рисуются так: calculate hbonds . После этого их можно убирать/показывать hbonds ON/OFF, делать толще или тоньше: hbonds 70 или другое число, изменять цвет color hbonds green. Остальные манипуляции см. в help'е или google Jmol tutorial.
Задание №3. Создайте изображения, демонстрирующие внутримолекулярные взаимодействия боковых цепей вида:
а) солевой мостик
- Нужны два изображения:
- изображение всех солевых мостиков в белке; следует указать их число и привести команды Jmol для их выделения
- изображение, детально демонстрирующее солевой мостик между одной парой аминокислотных остатков цепей; следует указать расстояние между донором и акцептором водорода (несколько расстояний, если взаимодействуют более одной пары атомов из выбранных остатков)
Подсказки Скачайте к себе и выполните Jmol скрипт atom-types.spt в котором определены множества hbnegative - отрицательно заряженные атомы аспарагиновой и глутаминовой кислот; hbpositive - положительно заряженные атомы аргинина и лизина.
Смена рабочей директории: cd <путь> или cd .. - как в linux
Выполнение скрипта: script <имя файла>
Ваши команды должны находить отрицательно заряженные атомы на расстоянии не более, чем 3.5 ангстрем от положительно заряженных атомов и наоборот; select within(...) и думайте дальше.
Выделить целиком аминокислотные остатки, содержащие данное множество атомов, можно командой select within(GROUP, <множество>). Например, можно сделать такое выделение:
select within(GROUP,within(3.5, arg*.nh?) and asp*.od?)
- arg*.nh? - множество, состоящее из всех атомов nh1 и nh2 всех аргининов; полное имя одного атома выглядит так: arg25:A.nh1 - атом nh1 25го аргинина в цепочке A. "*" и "?" работают как обычно в масках.
- внутренний оператор within(...) выделяет все атомы на расстоянии меньше чем заданное от указанного множества атомов аргининов
- оператор AND ограничивает полученное множество только указанными атомами из остатков аспарагиновых кислот
- оператор within(GROUP, ...) выделяет целиком те остатки, которым принадлежат найденные атомы аспарагиновых кислот
- Для изображения линии, связывающей донора и акцептора (выбранных вами самостоятельно) используйте команды:
select <один атом, второй атом>
connect hbond
Например,
select asn123:A.nd2,ser201:A.og
connect hbond
Будут связаны отрезком как для водородной связи два указанных атома.
См. в help'е другие возможности connect. Можно, указав порог расстояния, изобразить этой командой много водородных связей одновременно.
ВОТ ТАК.
б) водородная связь, не являющаяся солевым мостиком
- Нужно одно детальное изображение; следует указать донора, акцептора и расстояние между ними.
Специальной команды для определения водородных связей боковых цепей в Jmol нет (:
В atom-types.spt определено множество hbprot - все атомы белка, способные участвовать в водородных связях. Также определены множества hdprot - доноры протона, haprot - акцепторы; hdaprot атомы, которые могут быть и донорами, и акцепторами, в зависимости от окружения.
в) дисудьфидный мостик между цистеинами
- Нужно одно детальное изображение; следует указать расстояние между атомами серы (*) и углы, характеризующие геометрию S-S связи.
Команда ssbonds
г)(*) водяной мостик (водородные связи "белок - молекула воды - белок")
Внимание:: Если соответствующих требованиям задания элементов в Вашем белке нет, то используйте любую другую структуру. Например, структуру инсулина для S-S мостика. Найти ее можно поиском в PDB.
Задание №4. Постройте изображение одного гидрофобного кластера атомов в белке
Используйте скрипт atom-types.spt, в котором все гидрофобные группы атомов белков определены командой define hfprot <перечисление>
Какие аминокислотные остатки содержат гидрофобные атомы, согласно скрипту? (откройте его и посмотрите на нужные команды define
Изобразите все гидрофобные атомные группы в полноатомной модели spacefill на фоне очень тонкой модели всего остального.
- Если вам удастся, то выделите один кластер - т.е. группу плотно прилегающих гидрофобных атомов, отделенную от остальных гидрофобных атомов, - и оставьте только ее изображение. Если нет, то остановитесь на предыдущем пункте.
Изображение сохраните, укажите размер и расположение гидрофобного кластера относительно структуры белка в свободных терминах
(*) В дополнение к собственной попытке выделить один гидрофобный кластер, можно воспользоваться сервисом CluD - он ровно это и делает.
(*) Задание №5. Определите шаг и число остатков на виток для одной альфа-спирали
Выбирайте самую длинную α-спираль! Если в вашем pdb-файле таковой нет, то используйте любой другой pdb-файл.
Ответы и рисунок, демонстрирующий измерения, поместите на страницу про остовные водородные связи и элементы вторичной структуры.
- Если какого-то из этих элементов структуры в Вашем белке нет вообще, обратитесь к преподавателю и он выдаст Вам для работы только с этим с недостающим элементом структуры другой PDB-файл.
Выберите в структуре одну α-спираль. Покажите на рисунке позицию выбранной спирали на цельной структуре цепи белка. На рисунке должны быть указаны соответствующие номера остатков напротив начала и конца спирали. Допускается сделать это как средствами Jmol, так и последующей обработкой изображения в любом графическом редакторе.
Для выбранной спирали выясните и приведите в отчете следующие параметры:
шаг спирали (в ангстремах). Под шагом спирали понимается расстояние вдоль оси спирали, соответствующее одному полному витку, то есть повороту на 360 градусов. Если шаг маленький, то спираль вьется очень часто, как плотно намотанная катушка например, а если большой - то редко.
число остатков спирали на один виток. Сколько на один такой шаг, на один виток, приходится аминокислотных остатков. Число может получиться дробным, ничего страшного.
(*) Задание №6. Пополните веб-страницу практикума 2 информацией (на русском языке) (см. ниже)
Часть пунктов, возможно, уже выполнены вами. Организуйте информацию удобно для читателя, в виде таблицы или аккуратного списке!
Это задание (кроме выравнивания) обязательно для зачёта блока.
- Идентификатор PDB
- Название структуры на русском (в скобках - на английском, указанное в файле). Если Вы испытываете трудность с переводом названия структуры или не знаете, что оно означает, обратитесь к преподавателю за советом.
- Общее количество цепей в PDB-файле, сколько разных, сколько одинаковых.
Какая цепь отвечает Вашему белку (приведите его название). Если название вашего белка из PDB-файла не соответствует тому, которое было у вашего белка в базе данных RefSeq - обдумайте возможные причины и опишите их. При трудностях обратитесь к преподавателю.
- Выравнивание последовательности вашего белка из семестра 1 и из PDB-файла (ссылка на файл) и комментарии об отличиях
- Список молекул, отличных от собственно белка и воды (для сложных органических молекул достаточно привести их условное название, указанное в файле, но если вы сможете привести их настоящее название - будет только лучше).
Сопроводите Ваш список/таблицу рисунком из Jmol, на котором видны все цепи белка и все молекулы, не относящиеся к белку и воде:
- Ионы - в шариковой модели, прочие низкомолекулярные соединения - в шариковой или проволочной, на Ваш выбор;
- На рисунке должна быть в явном виде показана вторичная структура всех белковых молекул в PDB-файле;
Также на рисунке должно быть явно видно (и описано в подписи, конечно), откуда Ваш белок начинается и как следует его цепь от N- до C-конца. В подсказках к этому заданию предлагается несколько способов достичь такого эффекта, в том числе позволяющий сделать картинку очень красивой и получить дополнительные баллы, но Вы можете придумать свой. Суть в том, чтобы преподаватель мог открыть Вашу страницу и попросить Вас указать, где начался белок, куда поворачивает цепочка белка после каждого элемента вторичной структуры, а Вы могли ответить!
Рисунки можно обрабатывать графическим редактором, добавлять в них подписи и т.п.