Учебная страница курса биоинформатики,
год поступления 2014
Занятие 6
Отчёт по заданию №1 должен быть выложен на сайт, со ссылкой со страницы семестра, к утру 25 марта 2016 г. Задания №2 и №3 будут проверяться на коллоквиуме, поэтому сохраните всю необходимую информацию по ним или будьте готовы получить ее непосредственно в ответ на запрос преподавателя.
1. Анализ множественного выравнивания трансмембранных белков
Цели задания: (1) проверить корректность предсказания сервиса TMHMM и (2) проверить консервативность различных частей трансмембранных белков.
Дополнительное задание по анализу выборки: см. в подсказках
! Напоминаю: Репрезентативную выборку нельзя составить по критерию "взять первые 10 хитов BLAST", поэтому ни в коем случае не делайте так.
Составьте репрезентативную выборку гомологов своего белка, состоящую из 200-300 белков. Для этого воспользуйтесь поиском BLAST на сайте EMBL EBI по кластерам UniRef50 (см. подробную инструкцию в подсказках к этому практикуму. Постройте множественное выравнивание отобранных гомологов вместе с вашим белком с помощью любой программы, которую считаете подходящей. В отчете при этом должны быть указано следующее:
- Параметры выборки: по какой базе данных проводился поиск, сколько находок было отобрано, какое e-value имела самая худшая из отобранных находок.
- Какой программой было построено множественное выравнивание.
- Ваша оценка качества выравнивания: нужно ли удалять из него какие-то плохо выровненные или короткие последовательности, описание таких удалений.
- Ссылка на итоговый файл с выравниванием в формате FASTA.
Загрузите множественное выравнивание в программу JalView. Мои советы по использованию этой программы можно найти тут, а более подробное описание функций JalView - тут. Добавьте к выравниванию дополнительную аннотацию (Annotation) положения трансмембранных спиралей. Для этого:
Добавьте новую пустую строку аннотации (или псевдо-последовательность) и назовите ее "TM_REAL" (см. в подсказках, как это сделать).
Переместите белок, для которого есть структура (то есть исходный белок) в верхнюю строку выравнивания. Прикрепите к нему эту структуру (см. в подсказках, как это сделать). Используя появившуюся связь между последовательностью и структурой, пометьте участки выравнивания, отвечающие трансмембранным спиралям в белке со структурой в строке-аннотации буквой "М".
Добавьте к выравниванию предсказание трансмембранных спиралей, выдаваемых программой TMHMM, для любого другого гомолога. Возьмите последовательность гомолога и получите для него результат предсказания TMHMM. Создайте новую строку аннотации (или псевдо-последовательность) и назовите ее "TM_PREDICTED", после чего нанесите вручную участки, предсказанные TMHMM, в эту строку.
Выберите цветовую схему (в меню Colour), которая позволит визуально различать гидрофобные и гидрофильные остатки. Если стандартные схемы не устраивают - в подсказках есть инструкция как задать свою схему. Затем в том же меню Colour установите галочку на "Above Identity Threshold" (теперь покрашены будут позиции с % идентичности выше заданного порога). Убедитесь, что цвета на структуре белка отвечают выбранной цветовой схеме. Покрутите белок так, чтобы его часть, ориентированная в n-сторону мембраны оказалась сверху, а ориентированная в p-сторону - снизу.
Сохраните полученное изображение структуры белка, в подписи к рисунку ОБЯЗАТЕЛЬНО укажите, как цветовая схема окрашивает какие остатки, а также какой порог идентичности был выбран в режиме "Above Identity Threshold". Опишите полученное изображение в отчете. Отчет обязательно должен содержать ответы на следующие вопросы, а также другие ваши наблюдения.
- Консервативны ли в вашем белке участки, относящиеся к трансмембранным спиралям, и какие аминокислотные остатки встречаются чаще в спиралях?
- Консервативны ли участки между спиралями (или, если спираль только одна - цитоплазматический участок)?
- Есть ли в трансмембранных спиралях вашего белка консервативные заряженные или просто полярные остатки? Если да, то как бы вы объяснили их присутствие?
- На качественном уровне опишите, насколько совпадают нанесения результатов программы TMHMM и реальной структурной информации на выравнивания. С чем, по-вашему, это связано в данном случае? Есть ли спирали, полностью "не замеченные" TMHMM или, наоборот, лишние предсказания?
2. База данных OPM
Обратите внимание: в базе данных OPM положительно заряженная часть мембраны показана КРАСНЫМИ шариками, хотя формально это атомы кислорода и они должны быть заряжены отрицательно.
Найдите в БД OPM выданный вам белок (поиск по идентификатору). Скачайте предсказание его расположения в мембране. Для этого белка определите:
Толщину гидрофобной части мембраны: можно измерить в Jmol (правая кнопка мыши => measure => distance; в PDBTM надо фон сделать черным); следите чтобы отрезок между атомами, выбранными для измерения, был перпендикулярен плоскости мембраны! Можно использовать информацию о толщине гидрофобной части мембраны из БД OPM.
Среднее количество остатков в трансмембранной части белка (номера остатков, погруженных в мембрану, есть в БД OPM).
В какой мембране находится белок (например, "внешняя мембрана бактерии" и т.п.).
С помощью поиска по уровням классификации найдите любой белок, в трансмембранной части которого не α-спирали, а β-листы. Выполните для него действия из п. 1.
3. База данных TCBD
Найдите в БД TCBD выданный вам белок и белок из п. 2 задания 2. Если они там обнаружены, посмотрите, что означают цифры TC-кода для этих белков. Переведите сведения на русский язык.
- Найдите субстраты этих белков в БД KEGG. Посмотрите, в каких метаболических путях они участвуют. На основании этого и других данных (например, описания в TCBD) сформулируйте, в чем состоит функция данных белков.