Учебный сайт

Бредихина Данилы

Учебный сайт Бредихина Данилы

Занятие 2: Реконструкция филогенетических деревьев

На предыдущем занятии были отобраны 7 бактерий, для которых было составлено филогенетическое дерево:

С помощью таксономического сервиса NCBI можно определить, к каким таксонам относятся выбранные бактерии:

Название Мнемоника Тип Класс Отряд Семейство
Bacillus subtilis BACSU Firmicutes Bacilli Bacillales Bacillaceae
Clostridium tetani CLOTE Firmicutes Clostridia Clostridiales Clostridiaceae
Enterococcus faecalis ENTFA Firmicutes Bacilli Lactobacillales Enterococcaceae
Geobacillus kaustophilus GEOKA Firmicutes Bacilli Bacillales Bacillaceae
Lactobacillus delbrueckii LACDA Firmicutes Bacilli Lactobacillales Lactobacillaceae
Listeria monocytogenes LISMO Firmicutes Bacilli Bacillales Listeriaceae
Staphylococcus epidermidis STAES Firmicutes Bacilli Bacillales Staphylococcaceae

На дереве отобранных бактерий можно найти ветви, выделяющие отдельные таксоны. Например, классы Bacilli и Clostridia разделены ветвью {CLOTE} vs {BACSU, ENTFA, GEOKA, LACDA, LISMO, STAES} (можно отметить, что эта ветвь не является нетривиальной). Отряд Lactobacillales выделен соответвующей ветвью (включающей два листа: ENTFA и LACDA); аналогичным образом выделен отряд Bacillales (ветвь {CLOTE, LACDA, ENTFA} vs {BACSU, GEOKA, LISMO, STAES}). Семество Bacillaceae также выделено ветвью: {BACSU, GEOKA} vs {CLOTE, LACDA, ENTFA, LISMO, STAES}.

Множественное выравнивание белков

Из предложенного списка функций белков была выбрана функция «Фактор инициации трансляции 2», которой соответствует мнемоника IF2. Получить из Swiss-Prot последовательности белков с данной функцией из отобранных бактерий можно с помощью программы JalView (File > Fetch Sequence(s)... и получить последовательности из Uniprot, введя через точку с запятой идентификаторы вида IF2_BACSU, где вторая часть идентификатора представляет собой мнемонику соответствующей бактерии) или аналогичным образом с использованием программы seqret:

seqret sw:if2_bacsu

Полученные последовательности были помещены в один файл в формате .fasta. При этом названия последовательностей были отредактированы так, чтобы они содержали только мнемонику видов.

Выравнивание отобранных белков можно получить, например, с помощью программы JalView (Web Service > Alignment > Muscle with Defaults). Ниже приведено изображение выравнивания в «блочной» форме с блоками шириной 100 остатков и раскраской по проценту идентичности.

Построенное выравнивание отобранных белков, а также проект JalView были сохранены в соответствующих файлах.

В выравнивании можно найти несколько диагностических позиций, по которым можно судить о том, относится ли та или иная последовательность выравнивания к некоторому таксону. Например, на изображении ниже диагностические позиции, выделяющие класс Bacilli, отмечены красными указателями; выделяющие отряд Bacillales - зелёными.

Реконструкция филогенетического дерева

В JalView доступны четыре метода для реконструкции филогенетического дерева, которые доступны из меню Calculate > Calculate Tree. Каждое из деревьев было сохранено в соответствующем файле. Приведённые ниже изображения созданы с помощью программы Mega.

Average Distance Using % Identity

В этом дереве присутствует ветвь {CLOTE, LACDA} vs {ENTFA, STAES, LISMO, GEOKA, BACSU, LACDA}, которая отсутствует в правильном дереве, и отсутствует ветвь {LACDA, ENTFA} vs {CLOTE, BACSU, GEOKA, LISMO, STAES}, которая присутствует в правильном дереве.

Neighbour Joining Using % Identity

В этом дереве также присутствует ветвь {CLOTE, LACDA} vs {ENTFA, STAES, LISMO, GEOKA, BACSU, LACDA}, которая отсутствует в правильном дереве и отсутствует ветвь {LACDA, ENTFA} vs {CLOTE, BACSU, GEOKA, LISMO, STAES}, которая присутствует в правильном дереве. Кроме того, данное реконструированное дерево содержит ветвь {GEOKA, LISMO} vs {CLOTE, ENTFA, STAES, BACSU, LACDA}, которой нет в правильном дереве (в нём есть ветвь {GEOKA, BACSU} vs {CLOTE, ENTFA, STAES, LISMO, LACDA}).

Стоит отметить, что дерево, реконструированное с помощью алгоритма Neighbour Joining, является неукоренённым.

Average Distance Using BLOSUM62

Все нетривиальные ветви этого дерева отличны от ветвей правильного дерева и перечислены ниже.

  • {LACDA, CLOTE} vs {LISMO, ENTFA, GEOKA, STAES, BACSU}
  • {LACDA, LISMO, ENTFA, CLOTE} vs {GEOKA, STAES, BACSU}
  • {LACDA, LISMO, ENTFA, CLOTE, GEOKA} vs {STAES, BACSU}
  • {LISMO, ENTFA} vs {LACDA, GEOKA, STAES, BACSU, CLOTE}

Neighbour Joining Using BLOSUM62

Из нетривиальных ветвей этого дерева (рассмотрено разрешение небинарного дерева, предложенное программой MEGA) лишь одна ветвь присутствует в правильном дереве: {LACDA, ENTFA} vs {GEOKA, STAES, LISMO, BACSU, CLOTE}. Три нетривиальные ветви, присутствующие в этом дереве и отсутствующие в правильном, приведены ниже.

  • {GEOKA, CLOTE} vs {LISMO, ENTFA, GEOKA, STAES, BACSU}
  • {GEOKA, CLOTE, BACSU} vs {STAES, LISMO, LACDA, ENTFA}
  • {GEOKA, CLOTE, BACSU, STAES} vs {LISMO, LACDA, ENTFA}

Можно отметить, что реконструированное с помощью алгоритма Neighbour Joining дерево является неукоренённым.

Maximum Parsimony

Полученный .fasta-файл с выравниванием можно импортировать в программу MEGA, а затем реконструировать дерево методом Maximum Parsimony (в меню Phylogeny). Изображение дерева, укоренённого в одну из ветвей (Subtree > Root), приведено ниже.

Это дерево имеет лишь одну нетривиальную ветвь, которая присутствует в правильном дереве: {LACDA, ENTFA} vs {GEOKA, STAES, LISMO, BACSU, CLOTE}. Три нетривиальные ветви этого дерева, которые отсутствуют в правильном дереве, приведены ниже.

  • {ENTFA, LACDA, LISMO} vs {STAES, BACSU, GEOKA, CLOTE}
  • {ENTFA, LACDA, LISMO, STAES} vs {BACSU, GEOKA, CLOTE}
  • {ENTFA, LACDA, LISMO, STAES, BACSU} vs {GEOKA, CLOTE}

Сервис TreeTop

С помощью сервиса TreeTop можно реконструировать филогенетическое дерево по выравниванию. После ввода выравнивания в соответствующее поле после некоторого времени ожидания открывается страница с результатами, которые также можно выслать по адресу электронной почты. Страница с результатами содержит информацию о параметрах алгоритма, выравнивание, реконструированные деревья в текстовом и графическом форматах, а также матрицу расстояний и скобочные формулы реконструированных деревьев.

Реконструированное при помощи этого сервиса дерево (на изображении выше) для рассматриваемого выравнивания совпадает по топологии с деревом, реконструированным с помощью алгоритма Average Distance Using BLOSUM62 в JalView.


Ссылки

  1. Файл if2_bacteria.fasta.
  2. Файл if2_bacteria_alignment.fasta.
  3. Файл if2_bacteria_alignment.jar.
  4. Файл average_distance_using_percent_identity.tre.
  5. Файл neighbour_joining_using_percent_identity.tre.
  6. Файл average_distance_using_blosum62.tre.
  7. Файл neighbour_joining_using_blosum62.tre.
  8. Таксономический сервис NCBI.
  9. Сервис TreeTop, созданный в НИИФХБ имени А. Н. Белозерского.
< На страницу семестра ∧ Наверх