Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2013

Занятие 7

Будьте готовы к проведению коллоквиума по второму блоку 3 апреля 2015 г. Коллоквиум будет состоять из двух частей: теоретических вопросов по пройденному материалу (примерные темы скоро будут доступны) и практической части. Во второй части преподаватель может на свой выбор попросить прокомментировать что-то из выложенного Вами на странице и/или попросить выполнить одно из заданий, аналогичных тренировочным.

Отчёт по заданию №3 должен быть выложен на сайт, со ссылкой со страницы семестра, к утру 3 апреля 2015 г. Задания №1 и №2 являются тренировочными и не проверяются

Задание 1: база данных OPM

Обратите внимание: в базе данных OPM положительно заряженная часть мембраны показана КРАСНЫМИ шариками, хотя формально это атомы кислорода и они должны быть заряжены отрицательно.

  1. Найдите в БД OPM выданный вам белок (поиск по идентификатору). Скачайте предсказание его расположения в мембране. Для этого белка определите:

    • Толщину гидрофобной части мембраны: можно измерить в Jmol (правая кнопка мыши => measure => distance; в PDBTM надо фон сделать черным); следите чтобы отрезок между атомами, выбранными для измерения, был перпендикулярен плоскости мембраны! Можно использовать информацию о толщине гидрофобной части мембраны из БД OPM.

    • Среднее количество остатков в трансмембранной части белка (номера остатков, погруженных в мембрану, есть в БД OPM).

    • В какой мембране находится белок (например, "внешняя мембрана бактерии" и т.п.).

  2. С помощью поиска по уровням классификации найдите любой белок, в трансмембранной части которого не α-спирали, а β-листы. Выполните для него действия из п. 1.

Задание 2: база данных TCBD

  1. Найдите в БД TCBD выданный вам белок и белок из п. 2 задания 1. Если они там обнаружены, посмотрите, что означают цифры TC-кода для этих белков. Переведите сведения на русский язык.

  2. Найдите субстраты этих белков в БД KEGG. Посмотрите, в каких метаболических путях они участвуют. На основании этого и других данных (например, описания в TCBD) сформулируйте, в чем состоит функция данных белков.

Задание 3: анализ множественного выравнивания

Цели задания: (1) проверить корректность предсказания сервиса TMHMM и (2) проверить консервативность различных частей трансмембранных белков.

! Напоминаю: Репрезентативную выборку нельзя составить по критерию "взять первые 10 хитов BLAST", поэтому ни в коем случае не делайте так.

  1. Составьте репрезентативную выборку гомологов своего белка, состоящую из 20-30 белков. Используйте поиск BLAST по отдельным доменам (Bacteria, Archaea, Eukaryotes). Если гомологи выданного белка встречаются у архей - в выборке должно быть несколько последовательностей архей, если гомологи встречаются у эукариот - то же самое; поэтому в отчете укажите, сколько последовательностей из каждого домена было выбрано. При поиске по бактериям имеет смысл исключить из поиска самые крупные бактериальные филумы (Proteobacteria, Firmicutes, Actinobacteria), чтобы получить больше редких последовательностей (более подробно см. тут).

  2. Постройте множественное выравнивание отобранных гомологов с помощью любой программы, которую считаете подходящей (например, Muscle).
  3. Загрузите множественное выравнивание в программу JalView. Мои советы по использованию этой программы можно найти тут, а более подробное описание функций JalView - тут.

    1. Добавьте к выравниванию дополнительную аннотацию (Annotation) положения трансмембранных спиралей. Для этого:
    2. Добавьте новую пустую строку аннотации и назовите ее "TM_REAL" (см. в подсказках, как это сделать).

    3. Переместите белок, для которого есть структура (то есть исходный белок) в верхнюю строку выравнивания. Прикрепите к нему эту структуру (см. в подсказках, как это сделать). Используя появившуюся связь между последовательностью и структурой, пометьте участки выравнивания, отвечающие трансмембранным спиралям в белке со структурой в строке-аннотации буквой "М".

  4. Добавьте к выравниванию предсказание трансмембранных спиралей, выдаваемых программой TMHMM, для любого другого гомолога. Возьмите последовательность гомолога и получите для него результат предсказания TMHMM. Создайте новую строку аннотации и назовите ее "TM_PREDICTED", после чего нанесите вручную участки, предсказанные TMHMM, в эту строку.

  5. Выберите цветовую схему (в меню Colour), которая позволит визуально различать гидрофобные и гидрофильные остатки. Если стандартные схемы не устраивают - в подсказках есть инструкция как задать свою схему. Затем в том же меню Colour установите галочку на "Above Identity Threshold" (теперь покрашены будут позиции с % идентичности выше заданного порога). Убедитесь, что цвета на структуре белка отвечают выбранной цветовой схеме. Покрутите белок так, чтобы его часть, ориентированная в n-сторону мембраны оказалась сверху, а ориентированная в p-сторону - снизу.

  6. Сохраните полученное изображение структуры белка, в подписи к рисунку ОБЯЗАТЕЛЬНО укажите, как цветовая схема окрашивает какие остатки, а также какой порог идентичности был выбран в режиме "Above Identity Threshold". Опишите полученное изображение в отчете. Можно сделать это отвечая на следующие вопросы:
    1. Консервативны ли в вашем белке участки, относящиеся к трансмембранным спиралям, и какие аминокислотные остатки встречаются чаще в спиралях?
    2. Консервативны ли участки между спиралями (или, если спираль только одна - цитоплазматический участок)?
    3. Есть ли в трансмембранных спиралях вашего белка консервативные заряженные или просто полярные остатки? Если да, то как бы вы объяснили их присутствие?
  7. На качественном уровне опишите, насколько совпадают нанесения результатов программы TMHMM и реальной структурной информации на выравнивания. С чем, по-вашему, это связано в данном случае? Есть ли спирали, полностью "не замеченные" TMHMM или, наоборот, лишние предсказания?