Занятие 2.

Срок выполнения заданий — 2 марта 2010 г. Отчёт по заданиям 1, 5, 6, 7 должен продолжать отчёт по предыдущему занятию (можно на той же веб-странице). Задания 2 и 3 — промежуточные, по ним развёрнутого отчёта составлять не надо, нужно лишь указать, какое семейство белков вы выбрали и какой программой выравнивали последовательности. Если сделаете дополнительные задания 4 и/или 8, то лучше вынести отчёты по ним на отдельные страницы.
  1. Пользуясь таксономическим сервисом NCBI: http://www.ncbi.nlm.nih.gov/taxonomy/, определите, к каким таксонам относятся отобранные вами бактерии. Есть ли на дереве отобранных бактерий ветви, выделяющие какие-нибудь из таксонов? Если да, укажите эти таксоны и соответствующие ветви.
     
  2. Из списка функций белков выберите одну: по белкам соответствующего семейства вы будете реконструировать филогенетическое дерево.

    ФункцияМнемоника
    Омега-субъединица ДНК-зависимой РНК-полимеразы RPOZ
    Фактор элонгации трансляции Ts EFTS
    Рибосомный белок L2 RL2
    Рибосомный белок S7 RS7
    Рибосомный белок S12 RS12
    Энолаза ENO

    Получите из Swiss-Prot последовательности белков с данной функцией из отобранных вами бактерий (для этого вспомните, как получить ID банка Swiss-Prot из мнемоники функции и мнемоники организма).
     

  3. Создайте выравнивание отобранных белков программой muscle или mafft (см. указания к прошлогоднему занятию 8).

    Рекомендуется для дальнейшей работы отредактировать fasta-файл с выравниванием, оставив от имён последовательностей только мнемонику видов — так легче будет разбираться с деревьями. Напоминание: именем в fasta формате считается слово, заключённое между знаком ">" и первым пробелом в той же строке (а если пробела нет, то до конца строки). Оставшаяся часть строки считается описанием.
     

  4. (* дополнительное) Импортируйте выравнивание в GeneDoc. Постарайтесь найти как можно больше диагностических позиций выравнивания, то есть таких, по которым можно судить о том, относится ли та или иная последовательность выравнивания к некоторому таксону.

    Указание. Удобно "подкрасить" позиции, консервативные внутри таксона. Для этого в GeneDoc в меню Groups выберите "Edit sequences groups", затем "New group", выберите для новой группы имя и цвет, затем выделите в списке имён последовательностей те, которые вы хотите добавить к группе, "Add", "OK". Если теперь в меню Groups отметить "Shade groups conserved", то позиции, консервативные внутри группы, покрасятся в соответствующий цвет. Диагностическими правильно считать позиции, в которых все последовательности из данного таксона содержат некоторый остаток, не встречающийся в этой позиции в последовательностях, не относящихся к такосну. Годятся и позиции, в которых все остатки принадлежат какой-либо функциональной группе в пределах таксона и не принадлежат этой группе вне таксона.
     

  5. Проведите реконструкцию дерева программой fprotpars. Сколько деревьев выдала программа? Приведите в отчёте скобочную формулу(ы) и изображение(я).

    Сравните полученное дерево (одно из деревьев, если их больше одного) с правильным. Если есть несовпадающие ветви, укажите, какие ветви есть в дереве, постренном fprotpars, но отсутствуют в правильном, и какие — наоборот.

    Указания. Программа fprotpars установлена на сервере kodomo-count как часть пакета EMBOSS. Программа принимает на вход выравнивание аминокислотных последовательностей.

    Информация: в программе fprotpars реализован метод максимальной бережливости (maximal parsimony). Программа выдаёт неукоренённое дерево без длин ветвей. Ответ не всегда единственен — довольно часто программа выдаёт несколько "одинаково бережливых" деревьев.
     

  6. Оцените эволюционные расстояния между последовательностями программой fprotdist. Приведите в отчёте матрицу расстояний (как преформатировнный текст). Насколько расстояния отклоняются от ультраметричности (на одном-двух примерах)? Насколько расстояния отклоняются от аддитивности (на каком-нибудь одном примере)?
     
  7. Получите две реконструкции дерева программой fneighbor, используя два алгоритма: UPGMA и Neighbor-Joining. Сравните результаты между собой, с результатом fprotpars и с правильным деревом.

    Указания. Программа fneighbor принимает на вход матрицу расстояний (в том же формате, в котором её выдаёт программа fprotdist). По умолчанию программа использует алгоритм Neighbor-Joining. Чтобы понять, как попросить её использовать алгоритм UPGMA, а также как установить желаемое имя файла со скобочной структурой ("tree file"), выполните команду

    fneighbor -help
    или
    tfm fneighbor

    Информация: алгоритм UPGMA выдаёт укоренённое дерево с длинами ветвей. Его можно применять, если справедлива гипотеза молекулярных часов (матрица расстояний не слишком далека от ультраметрической). Алгоритм Neighbor-Joining выдаёт неукоренённое дерево с длинами ветвей; не предполагает молекулярных часов.

  8. (* дополнительное) Ознакомьтесь с созданным в НИИФХБ имени А.Н. Белозерского сервисом TreeTop и опишите результаты его работы и свои впечатления.