Учебная страница курса биоинформатики,
год поступления 2013
Занятие 5
Отчёт по заданию №4 должен быть выложен на сайт, со ссылкой со страницы семестра, к утру 20 марта 2015. Задание №1 является тренировочным: на коллоквиуме вам будет предложено такое же задание для произвольного кода EC. Задания №2-3 вы сдаете на коллоквиуме, который будет в конце блока, т.е. показываете свои результаты по заданию.
1. Извлечение информации о ферментативной активности из БД ENZYME
Выберите один из следующих EC:
1.1.1.1
1.2.4.2
2.3.3.8
5.3.1.9
С помощью базы данных ENZYME найдите информацию об этой ферментативной активности. Расшифруйте каждую цифру EC-кода. Какие участвующие в реакции вещества являются кофакторами или переносчиками различных групп, а какие являются собственно субстратом(ами) и продуктом(ами)? Рассмотрите основное название фермента и альтернативные названия фермента (если они есть). Что отражают альтернативные названия?
2. Работа с KEGG PATHWAY
Выберите для дальнейшей работы один из следующих биохимических путей:
- Гликолиз/Глюконеогенез;
- Цикл Кребса (цикл трикарбоновых кислот, цикл лимонной кислоты);
- Пентозофосфатный путь;
- Синтез жирных кислот;
Деградация жирных кислот (β-окисление);
- Метаболизм простых эфиров (ether);
- Метаболизм пуринов;
- Метаболизм пиримидинов;
Для выбранного пути сделайте следующее:
Приведите ссылку на базу данных KEGG с картой метаболического пути.
- Соберите краткую характеристику пути на русском языке (можно посмотреть, что про путь написано на соответствующей странице KEGG, можно посмотреть в учебниках/Википедии): для чего он служит, какие вещества являются для данного пути начальными, а какие - конечными?
- Посмотрите, с какими другими путями выбранный вами путь связан по данным базы KEGG, через какие вещества осуществляется эта связь?
- Из списка организмов, доступных для рассмотрения в БД KEGG, выберите три организма: любую бактерию, любую архею и любого эукариота. Зафиксируйте латинские и русские названия этих организмов. К каким таксономическим группам (филум, класс и т.п.) относятся эти организмы?
- Получите карты KEGG для каждого из этих организмов. Присутствуют ли какие-нибудь ферменты, относимые к данному пути, у каждого из выбранных организмов? Образуют ли они цепи последовательных реакций? На основании этого сделайте предположение о том, способны ли выбранные организмы осуществлять данный путь (целиком, его отдельные части)?
3. Работа с KEGG REACTION
- Для выбранного в п.2 метаболического пути найдите любую реакцию, в которой принимает участие один из сложных органических кофакторов (см. список на странице семестра).
Сохраните ссылку на страницу данной реакции в БД KEGG REACTION и ее идентификатор (он имеет формат Rxxxxx).
- Сохраните картинку метаболического пути (не для отдельного организма, а общего - Reference Pathway) с данной реакцией покрашенной выбранным вами цветом (см. подсказку ниже).
Сохраните изображение реакции с изображениями структурных формул веществ. Подпишите русское название участвующих веществ. Будьте готовы показать на химических структурах те изменения, которые происходят с ними в ходе реакции (аналогичное задание вы получите на контрольной).
Подсказка: покрасить ту или иную реакцию можно средствами самого KEGG так, как вам хочется. На странице с метаболическим путем выберите пункт "User data mapping". В появившееся окно можно вводить любой идентификатор (для реакции, для ортологичного ряда, для конкретного вещества, код EC), и после пробела давать цвета, в которые нужно покрасить встретившиеся на этой карте элементы.
Например: попробуйте следующие варианты для пути "Fatty acid degradation":
- R04754 #00FFFF,yellow
- 1.3.3.6 #00FFFF,yellow
- K06445 #00FFFF,yellow
4. Работа с KEGG ORTHOLOGY
Цель данного задания - проверить, являются ли члены разных ортологических рядов KEGG гомологичными белками.
Для выбранного в п.2 метаболического пути найдите любую реакцию, которую катализирует несколько ортологических рядов белков: не менее двух, но не более четырех (при наведении мыши на EC такой реакции вы увидите список из рядов; один ряд имеет формат идентификатора Kzzzzz). Проверьте также, чтобы в каждом из рядов было не более 100 белков, иначе будет сложнее работать дальше.
Сохраните ссылку на страницы этих рядов в БД KEGG ORTHOLOGY и их идентификаторы; приведите ее на отчетной странице.
Сохраните картинку метаболического пути (не для отдельного организма, а общего - Reference Pathway) с данной реакцией покрашенной выбранным вами цветом; приведите ее на отчетной странице.
Получите последовательности для каждого ортологического ряда (см. подсказку ниже). Модифицируйте идентификаторы каждого белка так, чтобы они содержали информацию об ортологическом ряде (например, принадлежащие ортологическому ряду K000001 белки XYZ_HUMAN и XYZ_MOUSE должны иметь идентификаторы XYZ_HUMAN|K00001 и XYZ_MOUSE|K00001). Приведите на отчетной странице идентификаторы ортологических рядов и количество последовательностей в каждом.
Постройте множественное выравнивание всех последовательностей из всех обнаруженных ортологических рядов с помощью программы Muscle. Сохраните множественное выравнивание и дайте на него ссылку на отчетной странице.
Откройте множественное выравнивание в программе Jalview (см. руководства по работе с Jalview: ДД, ААл), покрасьте множественное выравнивание с помощью любой окраски, учитывающей природу аминокислотных остатков. Сохраните проект Jalview ('.jvp' или '.jar' в старой версии) и добавьте ссылку на проект на свою отчетную страницу.
- Есть ли в выравнивании белки, которые очень плохо выровнены с остальными? Относятся ли они все к отдельному ортологическому ряду? Если да, то удалите эти белки из выравнивания перед следующим шагом и опишите на отчетной странице свои действия.
Постройте филогенетическое дерево для выбранных белков (программой MEGA, методом Neighbor-Joining, со 100 бутстреп-репликами). Сохраните изображение дерева и приведите его на отчетной странице.
- На основании своих данных ответьте на следующие вопросы:
- Распадается ли дерево на клады, соответствующими отдельным ортологическим рядам, которые вы рассматривали? Если да, то что можно сказать о величине поддержки бутстрепом ветвей, отделяющих эти клады от остального дерева?
- Есть ли на дереве тривиальные ветви, длины которых существенно отличаются от длин прочих тривиальных ветвей? Если да, то посмотрите на эти последовательности на выравнивании: насколько хорошо выровнены эти белки?
- Если у вас есть еще какие-то комментарии и соображения, опишите их.
Подсказка: получить последовательности белков одного ортологического ряда KEGG можно так. Щелкните на кнопку "UniProt" и вы получите список идентификаторов белков в виде таблицы. Скопируйте эту таблицу в Excel (или LibreCalc и т.п.), выделите вторую колонку таблицы (с идентификаторами Uniprot вида, например, CRP_ECOLI) и скопируйте список белков в буфер обмена. Этот список можно подавать сервису "Retrieve/ID mapping" БД Uniprot и получить последовательности.