Отчёт по заданиям 1, 5, 6, 7 должен продолжать отчёт по предыдущему занятию (можно на той же веб-странице). Задания 2 и 3 промежуточные, по ним развёрнутого отчёта составлять не надо, нужно лишь указать, какое семейство белков вы выбрали и какой программой выравнивали последовательности. Если сделаете дополнительные задания 4 и/или 8, то лучше вынести отчёты по ним на отдельные страницы.
Функция | Мнемоника |
Фактор элонгации трансляции G | EFG |
Фактор инициации трансляции 2 | IF2 |
Фактор элонгации трансляции 4 | LEPA |
Рибосомный белок S2 | RS2 |
Рибосомный белок L3 | RL3 |
Получите из Swiss-Prot последовательности белков
с данной функцией из отобранных вами бактерий
(для этого вспомните, как получить ID банка Swiss-Prot из мнемоники функции
и мнемоники организма).
Рекомендуется для дальнейшей работы отредактировать fasta-файл с выравниванием,
оставив от имён последовательностей только мнемонические обозначения организмов
так легче будет разбираться с деревьями. Напоминание: именем в fasta формате
считается слово, заключённое между знаком ">" и первым пробелом в той же строке
(а если пробела нет, то до конца строки). Оставшаяся часть строки считается описанием.
Указание. Удобно "подкрасить" позиции, консервативные внутри таксона.
Для этого в GeneDoc в меню Groups выберите "Edit sequences groups", затем
"New group", выберите для новой группы имя и цвет, затем выделите в списке имён
последовательностей те, которые вы хотите добавить к группе, "Add", "OK".
Если теперь в меню Groups отметить "Shade groups conserved", то позиции, консервативные
внутри группы, покрасятся в соответствующий цвет. Диагностическими правильно
считать позиции, в которых все последовательности из данного таксона содержат
некоторый остаток, не встречающийся в этой позиции в последовательностях, не относящихся
к этому таксону. Годятся и позиции, в которых все остатки принадлежат какой-либо
функциональной группе в пределах таксона и не принадлежат этой группе вне таксона.
Сравните полученное дерево (одно из деревьев, если их больше одного) с правильным. Если есть несовпадающие ветви, укажите, какие ветви есть в дереве, построенном fprotpars, но отсутствуют в правильном, и какие наоборот.
Указания. Программа fprotpars установлена на сервере kodomo как часть пакета EMBOSS. Программа принимает на вход выравнивание аминокислотных последовательностей.
Информация: в программе fprotpars реализован метод максимальной
экономии (или "бережливости", maximal parsimony).
Программа выдаёт неукоренённое дерево без длин ветвей.
Ответ не всегда единственен довольно часто программа выдаёт несколько
"одинаково экономных" деревьев.
Указания. Программа fneighbor принимает на вход матрицу расстояний (в том же формате, в котором её выдаёт программа fprotdist). По умолчанию программа использует алгоритм Neighbor-Joining. Чтобы понять, как попросить её использовать алгоритм UPGMA, а также как установить желаемое имя файла со скобочной структурой ("tree file"), выполните команду
fneighbor -helpили
tfm fneighbor
Информация: алгоритм UPGMA выдаёт укоренённое дерево с длинами ветвей. Его можно применять, если справедлива гипотеза молекулярных часов (матрица расстояний не слишком далека от ультраметрической). Алгоритм Neighbor-Joining выдаёт неукоренённое дерево с длинами ветвей; не предполагает молекулярных часов.