Отчёт по заданиям 1, 5, 6, 7 должен продолжать отчёт по предыдущему занятию (можно на той же веб-странице). Задания 2 и 3 — промежуточные, по ним развёрнутого отчёта составлять не надо, нужно лишь указать, какое семейство белков вы выбрали и какой программой выравнивали последовательности. Если сделаете дополнительные задания 4 и/или 8, то лучше вынести отчёты по ним на отдельные страницы.
Функция | Мнемоника |
Омега-субъединица ДНК-зависимой РНК-полимеразы | RPOZ |
Фактор элонгации трансляции Ts | EFTS |
Рибосомный белок L2 | RL2 |
Рибосомный белок S7 | RS7 |
Рибосомный белок S12 | RS12 |
Энолаза | ENO |
Получите из Swiss-Prot последовательности белков
с данной функцией из отобранных вами бактерий
(для этого вспомните, как получить ID банка Swiss-Prot из мнемоники функции
и мнемоники организма).
Рекомендуется для дальнейшей работы отредактировать fasta-файл с выравниванием,
оставив от имён последовательностей только мнемонические обозначения организмов —
так легче будет разбираться с деревьями. Напоминание: именем в fasta формате
считается слово, заключённое между знаком ">" и первым пробелом в той же строке
(а если пробела нет, то до конца строки). Оставшаяся часть строки считается описанием.
Указание. Удобно "подкрасить" позиции, консервативные внутри таксона.
Для этого в GeneDoc в меню Groups выберите "Edit sequences groups", затем
"New group", выберите для новой группы имя и цвет, затем выделите в списке имён
последовательностей те, которые вы хотите добавить к группе, "Add", "OK".
Если теперь в меню Groups отметить "Shade groups conserved", то позиции, консервативные
внутри группы, покрасятся в соответствующий цвет. Диагностическими правильно
считать позиции, в которых все последовательности из данного таксона содержат
некоторый остаток, не встречающийся в этой позиции в последовательностях, не относящихся
к такосну. Годятся и позиции, в которых все остатки принадлежат какой-либо
функциональной группе в пределах таксона и не принадлежат этой группе вне таксона.
Сравните полученное дерево (одно из деревьев, если их больше одного) с правильным. Если есть несовпадающие ветви, укажите, какие ветви есть в дереве, построенном fprotpars, но отсутствуют в правильном, и какие — наоборот.
Указания. Программа fprotpars установлена на сервере kodomo как часть пакета EMBOSS. Программа принимает на вход выравнивание аминокислотных последовательностей.
Информация: в программе fprotpars реализован метод максимальной
экономии (или "бережливости", maximal parsimony).
Программа выдаёт неукоренённое дерево без длин
ветвей. Ответ не всегда единственен — довольно часто программа выдаёт несколько
"одинаково экономных" деревьев.
Указания. Программа fneighbor принимает на вход матрицу расстояний (в том же формате, в котором её выдаёт программа fprotdist). По умолчанию программа использует алгоритм Neighbor-Joining. Чтобы понять, как попросить её использовать алгоритм UPGMA, а также как установить желаемое имя файла со скобочной структурой ("tree file"), выполните команду
fneighbor -helpили
tfm fneighbor
Информация: алгоритм UPGMA выдаёт укоренённое дерево с длинами ветвей. Его можно применять, если справедлива гипотеза молекулярных часов (матрица расстояний не слишком далека от ультраметрической). Алгоритм Neighbor-Joining выдаёт неукоренённое дерево с длинами ветвей; не предполагает молекулярных часов.