#pragma css /css/2014.css
<<BI>>

= Занятие 5 =
'''Отчёт по заданию №1 должен быть выложен на сайт, со ссылкой со страницы семестра, к утру 25 марта 2016.'''
{{{#!wiki dotted green
'''Хорошая новость''': По многочисленным просьбам (из-за загрузки по контрольным) срок сдачи практикума увеличен на неделю, до 25 марта 2016 г.
}}}

Задание №2 является тренировочным: на коллоквиуме вам будет предложено такое же задание для произвольного кода EC.
Задания №3-4 вы сдаете на коллоквиуме, который будет в конце блока, т.е. показываете свои результаты по заданию.

== 1. Работа с KEGG ORTHOLOGY ==
 
Цель данного задания -- проверить, являются ли члены разных ортологических рядов KEGG гомологичными белками, и проанализировать их филогенетические отношения.

 * В каком-нибудь из метаболических путей (см. список в задании 3) найдите любую реакцию, которую катализирует несколько ортологических рядов белков: не менее двух, но не более четырех (при наведении мыши на EC такой реакции вы увидите список из рядов; один ряд имеет формат идентификатора `Kzzzzz`). Желательно, чтобы в каждом из рядов было не более 100 белков, иначе будет сложнее работать дальше.
 * Сохраните ссылки на страницы этих рядов в БД KEGG ORTHOLOGY и их идентификаторы; '''приведите их на отчетной странице'''.
 * Сохраните картинку метаболического пути (не для отдельного организма, а общего -- Reference Pathway) с данной реакцией покрашенной выбранным вами цветом (см. подсказку к заданию 4); '''приведите ее на отчетной странице'''.
 * Получите последовательности для каждого ортологического ряда (см. подсказку ниже). Модифицируйте идентификаторы каждого белка так, чтобы они содержали информацию об ортологическом ряде (например, принадлежащие ортологическому ряду `K000001` белки `XYZ_HUMAN` и `XYZ_MOUSE` должны иметь идентификаторы `XYZ_HUMAN|K00001` и `XYZ_MOUSE|K00001`) -- это удобнее всего сделать с помощью простого скрипта на Python. '''Приведите на отчетной странице идентификаторы ортологических рядов и количество последовательностей в каждом.'''
 * Постройте множественное выравнивание всех последовательностей из всех обнаруженных ортологических рядов с помощью программы Muscle. '''Сохраните множественное выравнивание и дайте на него ссылку на отчетной странице'''.
 * Откройте множественное выравнивание в программе Jalview (см. руководства по работе с Jalview: [[http://kodomo.cmm.msu.ru/wiki/2012/2/hints_b2_jalview|ДД]], [[http://kodomo.cmm.msu.ru/wiki/Main/JalView|ААл]]), покрасьте множественное выравнивание с помощью любой окраски, '''учитывающей природу аминокислотных остатков'''. Сохраните проект Jalview ('.jvp' или '.jar' в старой версии) и '''добавьте ссылку на проект на свою отчетную страницу'''.
 * Добавьте в отчет пункт '''Гомологичность белков в выравнивании''' и ответьте на вопрос - выровнены ли между собой последовательности, т.е. существует ли множественное выравнивание вообще? Опишите свои наблюдения подробнее.
 * Добавьте в отчет пункт '''Проверка выравнивания''' и проведите эту проверку по такому плану:
  * Есть ли в выравнивании белки, которые очень плохо выровнены с остальными? Относятся ли они все к отдельному ортологическому ряду? Если да, то удалите эти белки из выравнивания перед следующим шагом и опишите свои действия.
  * Есть ли в выравнивании короткие белки, которые содержат много гэпов в тех участках, где в других последовательностях выравнивания консервативные колонки? Если да, то удалите эти белки из выравнивания перед следующим шагом и опишите на отчетной странице свои действия. '''ВАЖНО: если в проекте Jalview и в дальнейшей работе останутся такие короткие последовательности, это  незачёт!'''
 * Если дерево можно строить, то постройте филогенетическое дерево (программой MEGA, методом Neighbor-Joining, со 100 бутстреп-репликами). Сохраните изображение дерева и '''приведите его на отчетной странице'''.
 * На основании своих данных ответьте на следующие вопросы:
  * Распадается ли дерево на клады, соответствующими отдельным ортологическим рядам, которые вы рассматривали? Если да, то что можно сказать о величине поддержки бутстрепом ветвей, отделяющих эти клады от остального дерева?
  * Есть ли на дереве тривиальные ветви, длины которых существенно отличаются от длин прочих тривиальных ветвей? Если да, то посмотрите на эти последовательности на выравнивании: насколько хорошо выровнены эти белки?
 * Если у вас есть еще какие-то комментарии и соображения, опишите их.

{{{#!wiki dotted green
'''Подсказка''': получить последовательности белков одного ортологического ряда KEGG можно так. Щелкните на кнопку "!UniProt" и вы получите список идентификаторов белков в виде таблицы. Скопируйте эту таблицу в Excel (или !LibreCalc и т.п.), выделите вторую колонку таблицы (с идентификаторами Uniprot вида, например, `CRP_ECOLI`) и скопируйте список белков в буфер обмена. Этот список можно подавать сервису '''"Retrieve/ID mapping"''' БД Uniprot и получить последовательности.
}}}

----

== 2. Извлечение информации о ферментативной активности из БД ENZYME ==

Выберите один из следующих EC:
 * `1.1.1.1`
 * `1.2.4.2`
 * `2.3.3.8`
 * `5.3.1.9`
С помощью базы данных [[http://enzyme.expasy.org/|ENZYME]] найдите информацию об этой ферментативной активности. Расшифруйте каждую цифру EC-кода. Какие участвующие в реакции вещества являются кофакторами или переносчиками различных групп, а какие являются собственно субстратом(ами) и продуктом(ами)? Рассмотрите основное название фермента и альтернативные названия фермента (если они есть). Что отражают альтернативные названия?

== 3. Работа с KEGG PATHWAY ==

Выберите для дальнейшей работы один из следующих биохимических путей:
 1. Метаболизм инозитолфосфата;
 1. Метаболизм простых эфиров (ether);
 1. Биосинтез лизина;
 1. Метаболизм глутатиона;
 1. Метаболизм пантоненовой кислоты и КоА;
 1. Биосинтез каротиноидов;

Для выбранного пути сделайте следующее:
 * Приведите ссылку на базу данных [[http://www.genome.jp/kegg/|KEGG]] с картой метаболического пути.
 * Соберите краткую характеристику пути на русском языке (можно посмотреть, что про путь написано на соответствующей странице KEGG, можно посмотреть в учебниках/Википедии): для чего он служит, какие вещества являются для данного пути начальными, а какие - конечными?
 * Посмотрите, с какими другими путями выбранный вами путь связан по данным базы KEGG, через какие вещества осуществляется эта связь?
 * Из списка организмов, доступных для рассмотрения в БД KEGG, выберите три организма: любую бактерию, любую архею и любого эукариота. Зафиксируйте латинские и русские названия этих организмов. К каким таксономическим группам (филум, класс и т.п.) относятся эти организмы?
 * Получите карты KEGG для каждого из этих организмов. Присутствуют ли какие-нибудь ферменты, относимые к данному пути, у каждого из выбранных организмов? Образуют ли они цепи последовательных реакций? На основании этого сделайте предположение о том, способны ли выбранные организмы осуществлять данный путь (целиком, его отдельные части)?
 
== 4. Работа с KEGG REACTION ==

 * Для выбранного в задании 3 метаболического пути найдите любую реакцию, в которой принимает участие один из сложных органических кофакторов (см. список на странице семестра).
 * Сохраните ссылку на страницу данной реакции в БД KEGG REACTION и ее идентификатор (он имеет формат `Rxxxxx`).
 * Сохраните картинку метаболического пути (не для отдельного организма, а общего -- Reference Pathway) с данной реакцией покрашенной выбранным вами цветом (см. подсказку ниже).
 * Сохраните изображение реакции с изображениями структурных формул веществ. Подпишите русское название участвующих веществ. Будьте готовы показать на химических структурах те изменения, которые происходят с ними в ходе реакции (''аналогичное задание вы получите на контрольной'').

{{{#!wiki dotted green
'''Подсказка''': покрасить ту или иную реакцию можно средствами самого KEGG так, как вам хочется. На странице с метаболическим путем выберите пункт "User data mapping". В появившееся окно можно вводить любой идентификатор (для реакции, для ортологичного ряда, для конкретного вещества, код EC), и после пробела давать цвета, в которые нужно покрасить встретившиеся на этой карте элементы.

'''Например''': попробуйте следующие варианты для пути "Fatty acid degradation":
 * R04754 #00FFFF,yellow
 * 1.3.3.6 #00FFFF,yellow
 * K06445 #00FFFF,yellow
}}}