## page was copied from 2016/4/task12
#pragma css /css/2020.css
<<BI>>

= Занятие 12. Трансмембранные белки =
'''Отчёт по занятию должен быть выложен на сайт, со ссылкой со страницы семестра'''. Записывайтесь в [[https://docs.google.com/forms/d/e/1FAIpQLSf4MZwQAS2Wm1qcfyUVG2BnNjL2aqUyniOj7uDptJQ9YXS6JQ/viewform?usp=sf_link|очередь на проверку]]. Задания, выполненные правильно до 6 мая - верный способ зачесть эту часть коллоквиума автоматом!

На коллоквиуме будет обсуждаться результат задания №4 и содержательные вопросы по результатам выполнения заданий №1 и №2; остальные являются промежуточными или второстепенными.

Каждому студенту [[https://kodomo.fbb.msu.ru/wiki/2020/4/task12_proteins|выделен]] отдельный трансмембранный белок, у которого в настоящее время нет близкого гомолога с экспериментально полученной трехмерной структурой (''terra incognita''). В двух словах: белки из текущей версии `SwissProt` сравнивались с белками, находящимися в `PDB` с помощью BLAST; те, у которых есть гомологи в PDB с e-value менее '''1e-20''' отбрасывались; из оставшихся брались только белки, содержащие '''не менее шести''' предсказанных трансмембранных спиралей; из них методом тыка отбирались белки для задания ('''UPD''': прокариотические).

Поскольку это белок из SwissProt, для него существует '''предсказание трехмерной структуры''', полученное с помощью [[https://www.nature.com/articles/s41586-021-03819-2|AlphaFold]]. 

Для выполнения задания вам понадобится:
 1. Последовательность выданного белка в формате FASTA (можно получить через [[https://www.uniprot.org/|Uniprot]]).
 1. Предсказание трехмерной структуры (раздел `Structure` записи в [[https://www.uniprot.org/|Uniprot]], справа от описания, под изображением модели, есть кнопка загрузки).

== 1. Знакомство с базой данных OPM ==
{{{#!wiki note
Обратите внимание: в базе данных OPM положительно заряженная часть мембраны показана КРАСНЫМИ шариками, хотя формально это атомы кислорода и они должны быть заряжены отрицательно.
}}} 
'''Цель задания:''' Научиться работать с базой данных OPM: искать белки, анализировать информацию, представленную в базе данных
 1. С помощью поиска по уровням классификации в базе данных [[https://www.opm.phar.umich.edu/|OPM]] найдите любой белок, в трансмембранной части которого находятся &beta;-листы. Поищите какой-нибудь интересный! :) ('''UPD по просьбам трудящихся''': можно выбрать вообще какой-то интересный вам трансмембранный белок, даже не &beta;-листовой. Но тогда с вас какой-то комментарий, почему выбрали его :) )
 1. Для этого белка определите:
  * '''Толщину гидрофобной части белка в мембране''': можно измерить в Jmol, если скачать с сайта представление белка в мембране (правая кнопка мыши => measure => distance); следите чтобы отрезок между атомами, выбранными для измерения, был перпендикулярен плоскости мембраны! Можно использовать информацию о толщине гидрофобной части из БД OPM, но нужно понимать (и отвечать на коллоквиуме), откуда это число берется и как соотносится с толщиной мембраны.
  * '''Координаты трансмембранных участков''' (номера остатков, погруженных в мембрану, указаны в БД).
  * '''Среднее количество остатков в одном &beta;-тяже белка'''.
  * '''В какой мембране находится белок''' (например, "внешняя мембрана бактерии" и т.п.).
 1. Напишите в отчете, какой белок вы выбрали (название, перевод его на русский язык, идентификатор PDB и идентификатор `Uniprot`).
 1. '''Полученные из OPM параметры приведите на сайте в виде таблицы'''.
 1. Получите изображение белка, где ''p''-сторона мембраны будет направлена вниз, а вторичная структура будет хорошо видна. '''Приведите изображение на странице''' с подписью.

== 2. DeepTMHMM: Предсказание трансмембранных элементов по последовательности белка ==
'''Цели задания:''' Опробовать сервер [[https://dtu.biolib.com/DeepTMHMM|DeepTMHMM]] на &alpha;-спиральном и &beta;-листовом белках.
 1. Запустите сервис `DeepTMHMM` для выданного вам &alpha;-спирального белка и для выбранного вами в задании №1 &beta;-листового белка. Сохраните результаты в графическом и текстовом видах. 
 1. '''Приведите результаты на сайте'''; в подписям к графической выдаче опишите подробно, что показано по осям и что каким цветом окрашено.

== 3. PPM: Предсказание положения выданного белка в мембране ==
'''Цель задания:''' получить предсказание положения белка в мембране с помощью сервера [[https://opm.phar.umich.edu/ppm_server|PPM]], который позволяет получить данные, которые обычно есть в базе `OPM`, для произвольной структуры белка.
 1. Выберите версию сервера `PPM 3.0` (мы за будущее!).
 1. Выберите параметры алгоритма. '''Укажите на отчетной странице, какие параметры вы использовали и почему'''. В частности, обязательно укажите, откуда Вы взяли данные для параметра `Topology (N-ter)`.
 1. Запустите алгоритм. Сохраните полученную модель, а также выданную программой информацию о координатах трансмембранных участков в белке.
 1. Напишите в отчете, какой белок был вам выдан (название, перевод его на русский язык, идентификатор `SwissProt`). 
 1. '''Полученные сервером PPM параметры приведите на сайте в виде таблицы''' (список параметров см. в задании 1).
 1. Получите изображение белка, где ''p''-сторона мембраны будет направлена вниз, а вторичная структура будет хорошо видна. '''Приведите изображение на странице''' с подписью.

== 4. Сравнение алгоритмов предсказания трансмембранных спиралей ==
 1. На качественном уровне опишите, насколько совпадают результаты программы `DeepTMHMM` со структурной информацией из БД `OPM` (и предсказанием сервера `PPM`) (результаты задания №2 и №4). Есть ли спирали/тяжи, полностью "не замеченные" предсказывающей программой или, наоборот, лишние предсказания?
 1. Модель вашего белка в БД `Uniprot` имеет легенду с оценкой качества предсказания в разных участках полученной структуры. Опишите качество предсказания: какие участки белка предсказаны достоверно, а какие нет? Как можно оценить предсказание в целом? Если это необходимо, приведите в отчете изображение модели с легендой. Ответьте в отчете на вопрос: '''могла ли достоверность модели оказать влияние на результаты предсказания сервера PPM'''? Ответ обоснуйте.

== 5. База данных TCDB ==
 1. Поищите в БД [[http://www.tcdb.org/|TCDB]] выданный вам белок и белок, который вы выбрали в задании №1 (искать нужно по идентификатору Uniprot, причем `AC`, а не `ID`: например, `P0A910`, а не `OMPA_ECOLI`). В `OPM` есть прямые ссылки на `TCDB`.
 1. Если они не обнаружены, опишите как вы искали и результат. Если какой-то белок обнаружен, посмотрите, что означают цифры его TC-кода. '''Переведите сведения на русский язык и представьте на отчетной странице'''.