Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2012

Для запуска Jmol на сайтах сервисов может потребоваться внесение их адресов в список разрешенных сайтов Java. Находится в настройках Java в разделе security.

На сегодняшний день поддержка Java в браузере Chrome прекращена. Используйте Firefox.

Задание d1: определение вторичной структуры

  1. Определите вторичную структуру одного из белков (своего, например; но: в белке должна быть хотя бы одна альфа-спираль и хотя бы один бета-лист) с помощью одной из программ: DSSP или Stride:

    • сохраните выдачу программы и поставьте на нее ссылку с веб-страницы
    • сравните границы 4 элементов вторичной структуры (лучше всего - двух тяжей и двух спиралей) по данным работы программы с границами, приведенными в заголовке PDB файла; (внимательно относитесь к тому, где какая нумерация используется!)
    • (*) найдите и опишите редкие элементы: мостики, пере- или недокрученные спирали, ...

Посказка: программы есть на kodomo, dssp называется mkdssp. Можно также найти сервисы в интернет.

  1. С помощью SheeP постройте карту одного из бета-листов в выбранной вами структуре белка и сопоставьте с изображением этого листа. (См. описание формата карт бета-листов тут )

    • SheeP: http://mouse.belozersky.msu.ru/sheep

    • Скопируйте картинку карты одного листа и изображение его же в структуре (SheeP умеет это изображение строить с помощью Jmol; в этом году Jmol уже нельзя запустить в Chrome - используйте FireFox). Обе поместите в отчет на веб-странице

    • Покажите соответствие одного столбца на карте и хребта в бета-листе.
    • Определите на карте бета-листа сторону, обращенную к гидрофобному ядру. (Остатки, расположенные с разных сторон листа, SheeP выделяет желтым и красным фоном соответственно.)

    • Для участка бета-листа (3 тяжа, 4-5 гребней) нарисуйте схему водородных связей. Карту постройте на основании данных программы stride (в качестве beta-sheets detector выберете Original STRIDE). Список водородных связей умеет выдавать консольная версия этой программы (разберитесь с параметрами!). На схеме укажите основные атомы и водородные связи между ними. Есть ли на выбранном участке нерегулярности (buldges)?

Задание d2: совмещение структур

  1. Постройте совмещение структур вашего (выданного на первом курсе? использованного для отчета по validation?) белка и четырех структурных гомологов

    • Используйте поиск по сходству структур в PDBeFold (можно использовать и другой сервис, если хочется). Можно регулировать:
      • цепочку, домен или часть структуры, по которой поиск;
      • процент одинаково расположенных тяжей и спиралей во входной структуре и в находке
    • Выберите структуры, не слишком сходные и не слишком различные.
    • Совместите пять структур и скачайте
      • выравнивание последовательностей по совмещению структур
      • совмещение структур ( указание )

    • Найдите и опишите отличие выравнивания последовательностей по структуре от выравнивания тех же последовательностей, построенной какой-либо программой множественного выравнивания (хотя бы одно отличие – пару остатков из разных белков, выровненных по структуре, но не выровненных программой выравнивания последовательностей)

      • для выравнивания по последовательностям удобно использовать JalView

      • в выравнивании по структуре следует смотреть только на БОЛЬШИЕ БУКВЫ; маленькие буквы считаются не выровненными
      • в местах отличий сверьтесь с совмещением структур и решите, какое из выравниваний правильное.
  2. Используйте поиск по сходству структур в PDBeFold (бывш. SSM). Осуществите поиск структурных гомологов для одного из доменов: 1b0m A:203-315, 1adj C:326-419, 1cii A: 284-384, 1dek A: 33-154. Отсортируйте результаты по RMSD. Найден ли сам такой домен в PDB? Если нет, то почему? (Обратите внимание на параметры на заглавной странице PDBeFold.)

  3. Совмещение по заданному выравниванию. Используйте команду pair_fit в PyMol.

    • Сохраните в формате PDB одну структуру константного домена T-клеточного рецептора из цепочки альфа и одну из - бета. Можно выбрать любые два домена из SCOP: http://scop.mrc-lmb.cam.ac.uk/scop/data/scop.b.c.b.b.c.dd.html и http://scop.mrc-lmb.cam.ac.uk/scop/data/scop.b.c.b.b.c.df.html .

    • Постройте карты бета-листов при помощи SheeP. Какой лист в цепочке бета соответствует листу в цепочке альфа?

    • Добейтесь того, чтобы карты соответствующих друг другу листов были в одной ориентации. (Надо понимать, что изменение порядка строк и/или столбцов в карте не меняет ее смысла.) Используйте ссылки flip rows and columns на странице с результатами SheeP.

    • Найдите в каждой карте консервативный остаток цистеина, образующий дисульфидную связь.
    • Теперь вы можете построить выравнивание этих бета-листов. Консервативные цистеины должны оказаться выровненными. Их выравнивание задает нам выравнивание всего центрального тяжа. (Обратите внимание, что длина этих тяжей в разных цепочках может быть различной. Следовательно, выровненными окажутся только части тяжей.) Остатки, спаренные с консервативным цистеином, также считайте выровненными. Они задают выравнивание еще каких-то тяжей. Так можно построить выравнивание целых листов. (Обратите внимание, что в картах бета-листов могут быть вставки, соответствующие нерегулярностям.)
    • Составьте команду для PyMol, которая совмещает структуры по полученному вами выравниванию.

    • Сделайте заключение о сходстве и/или различии топологий. Совпадает ли общий ход полипептидной цепи в пространстве? Обратите внимание на петли - при совпадении топологий каждой петле в одной структуре соответствует петля в другой.
    • Отчет должен содержать: Координаты выбранных доменов, карты бета-листов в одинаковой ориентации, команду pair_fit для PyMol, рисунок и файл с совмещением, заключение о сходстве топологий.

Задание d3: Нахождение гидрофобных кластеров

  1. Найдите гидрофобные кластеры в структуре какого-либо белка и опишите результат

    • Используйте Clud: http://mouse.belozersky.msu.ru/npidb/cgi-bin/hftri.pl

    • Меняйте параметры порог расстояния и порог размера кластера, чтобы получить лучше интерпретируемый результат
    • Опишите соответствие кластеров доменам и субдоменам белка, определяемым визуально или как-либо иначе
  2. Найдите гидрофобные кластеры на интерфейсе двух цепочек в структуре какого-либо белка (или комплекса с НК) и опишите результат.

Задание d4: Построение поверхности, раскраска участка поверхности: pymol

  1. Для комплекса димера пуринового репрессора с ДНК ( тут список ) создайте изображения:

а) поверхности контакта мономера белка с симметричным мономером на фоне остовной (ribbon) модели мономера; б) поверхности контакта димера белков с двойной спиралью ДНК на фоне остовной модели части белка, вовлечённой в контакт; в) поверхности контакта ДНК с димером белков на фоне проволочной (sticks) модели двойной спирали.

  1. Пользуясь сервисом CluD, определите гидрофобные кластеры объёмом не менее 10 атомов на интерфейсе мономеров белка в том же комплексе. Создайте то же изображение, что в задании 7а, на котором поверхность, относящаяся к атомам, входящим в найденные гидрофобные кластеры, выделена цветом.

Задание d5: Сравнение доменов SCOP/SCOPe, ECOD, CATH и Pfam

  1. Для какого-нибудь белка с известной структурой найдите границы доменов согласно различным классификациям. Опишите и прокомментируйте различия.

Прим. Границы доменов CATH проще всего посмотреть в файле с описанием последней версии классификации. Файл P:\y12\term7\CathDomainDescriptionFile.v4.0.0 .

Задание d6: Использование сайта PDB

  1. (*) Найдите на сайте PDB ссылки на FTP хранилище файлов. Напишите программу на любом языке программирования (bash, python, etc), которая скачивает pdb файл по указанному ID. Можно использовать вызовы стандартных программ Linux. Учтите, что некоторые файлы помечены как obsolete. Желательно, чтобы ваш скрипт предупреждал об этом пользователя.

  2. (*) Добавьте в ваш скрипт возможность автоматически получить не только целый PDB файл, но и какую-либо его часть (на выбор: указанную цепочку или несколько, указанный участок цепи, все белковые цепочки, структуру без молекул воды или низкомолекулярных лигандов, восстановленную биологическую единицу или часть кристалла, иное).

12. (ААл) Получите Excel таблицу структур филаментов, определенных при помощи метода электронной микроскопии. Отфильтруйте так, чтобы не оставалось белков со сходством выше 50% идентичных остатков. В таблице должны быть указаны: PDB код; название структуры; метод решения; разрешение и разрешение метода EM; классификация; главная публикация. Используйте Advances search. Достаточно выполнить одно из заданий 12

12. (ЕА) Скачайте все последовательности белков, структуры которых определенны при помощи метода электронной микроскопии, в виде одного FASTA файла. Используйте Advances search.

13. (ЕА) Сравните список структурных гомологов, определенных для вашего белка программой PDBeFold с таким же списком из программы jFATCAT. Последний список есть прямо на странице PDB. Достаточно выполнить одно из заданий 12

13. (ААл) Найдите пару белков, для которых гибкое структурное выравнивание включает существенно больше остатков, чем жесткое. Спрашивайте статьи или примеры из них у докладчиков по гибкому структурному выравниванию. Для каждого белка в PDB есть страница со списком структурных гомологов из программы jFATCAT. Для сравнения с жестким выравниванием можно запустить PDBeFold или другую программу жесткого совмещения.