Учебная страница курса биоинформатики,
год поступления 2020
Занятие 12. Трансмембранные белки
Отчёт по занятию должен быть выложен на сайт, со ссылкой со страницы семестра. Записывайтесь в очередь на проверку. Задания, выполненные правильно до 6 мая - верный способ зачесть эту часть коллоквиума автоматом!
На коллоквиуме будет обсуждаться результат задания №4 и содержательные вопросы по результатам выполнения заданий №1 и №2; остальные являются промежуточными или второстепенными.
Каждому студенту выделен отдельный трансмембранный белок, у которого в настоящее время нет близкого гомолога с экспериментально полученной трехмерной структурой (terra incognita). В двух словах: белки из текущей версии SwissProt сравнивались с белками, находящимися в PDB с помощью BLAST; те, у которых есть гомологи в PDB с e-value менее 1e-20 отбрасывались; из оставшихся брались только белки, содержащие не менее шести предсказанных трансмембранных спиралей; из них методом тыка отбирались белки для задания (UPD: прокариотические).
Поскольку это белок из SwissProt, для него существует предсказание трехмерной структуры, полученное с помощью AlphaFold.
Для выполнения задания вам понадобится:
Последовательность выданного белка в формате FASTA (можно получить через Uniprot).
Предсказание трехмерной структуры (раздел Structure записи в Uniprot, справа от описания, под изображением модели, есть кнопка загрузки).
1. Знакомство с базой данных OPM
Обратите внимание: в базе данных OPM положительно заряженная часть мембраны показана КРАСНЫМИ шариками, хотя формально это атомы кислорода и они должны быть заряжены отрицательно.
Цель задания: Научиться работать с базой данных OPM: искать белки, анализировать информацию, представленную в базе данных
С помощью поиска по уровням классификации в базе данных OPM найдите любой белок, в трансмембранной части которого находятся β-листы. Поищите какой-нибудь интересный! (UPD по просьбам трудящихся: можно выбрать вообще какой-то интересный вам трансмембранный белок, даже не β-листовой. Но тогда с вас какой-то комментарий, почему выбрали его )
- Для этого белка определите:
Толщину гидрофобной части белка в мембране: можно измерить в Jmol, если скачать с сайта представление белка в мембране (правая кнопка мыши => measure => distance); следите чтобы отрезок между атомами, выбранными для измерения, был перпендикулярен плоскости мембраны! Можно использовать информацию о толщине гидрофобной части из БД OPM, но нужно понимать (и отвечать на коллоквиуме), откуда это число берется и как соотносится с толщиной мембраны.
Координаты трансмембранных участков (номера остатков, погруженных в мембрану, указаны в БД).
Среднее количество остатков в одном β-тяже белка.
В какой мембране находится белок (например, "внешняя мембрана бактерии" и т.п.).
Напишите в отчете, какой белок вы выбрали (название, перевод его на русский язык, идентификатор PDB и идентификатор Uniprot).
Полученные из OPM параметры приведите на сайте в виде таблицы.
Получите изображение белка, где p-сторона мембраны будет направлена вниз, а вторичная структура будет хорошо видна. Приведите изображение на странице с подписью.
2. DeepTMHMM: Предсказание трансмембранных элементов по последовательности белка
Цели задания: Опробовать сервер DeepTMHMM на α-спиральном и β-листовом белках.
Запустите сервис DeepTMHMM для выданного вам α-спирального белка и для выбранного вами в задании №1 β-листового белка. Сохраните результаты в графическом и текстовом видах.
Приведите результаты на сайте; в подписям к графической выдаче опишите подробно, что показано по осям и что каким цветом окрашено.
3. PPM: Предсказание положения выданного белка в мембране
Цель задания: получить предсказание положения белка в мембране с помощью сервера PPM, который позволяет получить данные, которые обычно есть в базе OPM, для произвольной структуры белка.
Выберите версию сервера PPM 3.0 (мы за будущее!).
Выберите параметры алгоритма. Укажите на отчетной странице, какие параметры вы использовали и почему. В частности, обязательно укажите, откуда Вы взяли данные для параметра Topology (N-ter).
- Запустите алгоритм. Сохраните полученную модель, а также выданную программой информацию о координатах трансмембранных участков в белке.
Напишите в отчете, какой белок был вам выдан (название, перевод его на русский язык, идентификатор SwissProt).
Полученные сервером PPM параметры приведите на сайте в виде таблицы (список параметров см. в задании 1).
Получите изображение белка, где p-сторона мембраны будет направлена вниз, а вторичная структура будет хорошо видна. Приведите изображение на странице с подписью.
4. Сравнение алгоритмов предсказания трансмембранных спиралей
На качественном уровне опишите, насколько совпадают результаты программы DeepTMHMM со структурной информацией из БД OPM (и предсказанием сервера PPM) (результаты задания №2 и №4). Есть ли спирали/тяжи, полностью "не замеченные" предсказывающей программой или, наоборот, лишние предсказания?
Модель вашего белка в БД Uniprot имеет легенду с оценкой качества предсказания в разных участках полученной структуры. Опишите качество предсказания: какие участки белка предсказаны достоверно, а какие нет? Как можно оценить предсказание в целом? Если это необходимо, приведите в отчете изображение модели с легендой. Ответьте в отчете на вопрос: могла ли достоверность модели оказать влияние на результаты предсказания сервера PPM? Ответ обоснуйте.
5. База данных TCDB
Поищите в БД TCDB выданный вам белок и белок, который вы выбрали в задании №1 (искать нужно по идентификатору Uniprot, причем AC, а не ID: например, P0A910, а не OMPA_ECOLI). В OPM есть прямые ссылки на TCDB.
Если они не обнаружены, опишите как вы искали и результат. Если какой-то белок обнаружен, посмотрите, что означают цифры его TC-кода. Переведите сведения на русский язык и представьте на отчетной странице.