Филогенетические деревья. Занятие 2

1.

Пользуясь таксономическим сервисом NCBI: http://www.ncbi.nlm.nih.gov/taxonomy/, определяю, к каким таксонам относятся отобранные бактерии. Привожу результат в виде таблицы.

НазваниеМнемоникаТаксономия (домен; тип; класс; порядок; семейство; род; группа, если указана)
Bacillus subtilisBACSUBacteria; Firmicutes; Bacilli; Bacillales; Bacillaceae; Bacillus; Bacillus subtilis group
Clostridium tetaniCLOTEBacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae; Clostridium
Geobacillus kaustophilusGEOKABacteria; Firmicutes; Bacilli; Bacillales; Bacillaceae; Geobacillus
Lactobacillus acidophilusLACACBacteria; Firmicutes; Bacilli; Lactobacillales; Lactobacillaceae; Lactobacillus
Lactococcus lactisLACLMBacteria; Firmicutes; Bacilli; Lactobacillales; Streptococcaceae; Lactococcus
Listeria monocytogenesLISMOBacteria; Firmicutes; Bacilli; Bacillales; Listeriaceae; Listeria
Staphylococcus aureusSTAA1Bacteria; Firmicutes; Bacilli; Bacillales; Staphylococcaceae; Staphylococcus

Соответствующее филогенетическое дерево

Все отобранные бактерии относятся к типу фирмикуты, 6 из 7 бактерий относятся к классу бациллы. Бактерия Clostridium tetani относится к классу клостридии - верхняя одинокая ветвь дерева CLOTE.

4 из 6 бактерий класса бациллы относятся к порядку Bacillales - нетривиальная ветвь {BACSU, GEOKA, LISMO, STAA1} против {CLOTE, LACAC, LACLM}. 2 из 6 относятся к порядку Lactobacillales - нетривиальная ветвь {LACAC, LACLM} против {CLOTE, BACSU, GEOKA, LISMO, STAA1}.

2 из 4 бактерий порядка Bacillales относятся к одному семейству Bacillaceae - нетривиальная ветвь {BACSU, GEOKA} против {CLOTE, LACAC, LACLM, LISMO, STAA1}. Другие 2 бактерии относятся к разным семействам порядка Bacillales - ветви LISMO и STAA1.

Бактерии порядка Lactobacillales принадлежат разным семействам - ветви LACAC и LACLM.

2.

Из списка функций белков выбираю функцию Фактор элонгации трансляции Ts (EFTS), по белкам соответствующего семейства далее реконструирую филогенетическое дерево.

С помощью Uniprot получила из Swiss-Prot последовательности нужных белков из отобранных бактерий. Использовала идентификаторы вида EFTS_BACSU (можно было также, например, использовать seqret sw:efts_bacsu на kodomo). Поместила последовательности в файл seq.fasta и отредактировала названия последовательностей, оставив только мнемонику видов (так легче будет разбираться с деревьями). Порядок последовательностей соответствует приведенному в таблице.

Импортирую невыровненные последовательности в JalView и использую Web Service, чтобы получить выравнивание (Web Service - Alignment - Muscle with Defaults).

Получаю изображение выравнивания в "блочной" форме (Format - Wrap), с раскраской по проценту идентичности.

В рабочей директории сохраняю проект efts.jar и выравнивание в fasta-формате.

3.

Ищу диагностические позиций выравнивания, по которым можно судить о том, относится ли та или иная последовательность выравнивания к некоторому таксону.

Для удобства поиска располагаю последовательности в порядке, соответствующем филогенетическому дереву. Окрашиваю диагностические позиции - более темный оттенок соответствует наиболее важным для определения принадлежности к таксону позициям. Обращаю особое внимание на остатки, имеющие различные свойства - отрицательный или положительный заряд, ароматичность, т.к., к примеру, замена валина на лейцин или аспартата на глутамат, вряд ли, повлияет на свойства белка.

Выделенные позиции для CLOTE - диагностические позиции, по которым можно судить о принадлежности к классу клостридии. По аналогии, видны позиции, говорящие о принадлежности к классу бацилл (для остальных 6 бактерий). Они высококонсервативны и окрашены темно-синими оттенками. Наиболее консервативные участки характерны для типа фирмикуты в целом.

Выделенные позиции для LACAC, LACLM говорят о принадлежности к порядку Lactobacillales.

Для BACSU, GEOKA, LISMO, STAA1 - диагностические позиции, по которым можно судить о принадлежности к порядку Bacillales.

Далее отдельно приведены выделенные позиции для BACSU, GEOKA, говорящие о принадлежности к семейству Bacillaceae. Отмечены позиции, которые выделяют семейство из порядка Bacillales.

4.

Реконструирую филогенетическое дерево четырьмя методами, доступными из JalView (меню Calculate - Calculate tree). Каждое дерево сохраняю в Newick-формате.

Получаю изображения деревьев, сделанные программой Mega.

Average Distance Using % Identity

Новые ветви: нет.

Отсутствующие ветви: нет.

Neighbour Joining Using % Identity

Новые ветви:

{LACLM, LACAC, GEOKA, BACSU} против {STAA1, LISMO, CLOTE},

{LISMO, LACLM, LACAC, GEOKA, BACSU} против {STAA1, CLOTE}.

Отсутствующие ветви:

{BACSU, GEOKA, LISMO} против {CLOTE, LACAC, LACLM, STAA1},

{BACSU, GEOKA, LISMO, STAA1} против {CLOTE, LACAC, LACLM}.

Average Distance Using BLOSUM62

Новые ветви:

{STAA1, LISMO} против {CLOTE, GEOKA, BACSU, LACLM, LACAC}.

Отсутствующие ветви:

{BACSU, GEOKA, LISMO} против {CLOTE, LACAC, LACLM, STAA1}.

Neighbour Joining Using BLOSUM62

Новые ветви: нет.

Отсутствующие ветви: нет.

5.

Импортирую выравнивание (файл в fasta-формате) в программу Mega (при импорте выбираю "Analyze"). Реконструирую дерево методом "Maximum Parsimony" (кнопка Phylogeny). Укореняю дерево в наиболее правильную ветвь (меню Subtree - Root).

Полученное изображение

Новые ветви:

{LISMO, STAA1} против {GEOKA, BACSU, LACAC, LACLM, CLOTE},

{LISMO, STAA1, GEOKA} против {BACSU, LACAC, LACLM, CLOTE}.

Отсутствующие ветви:

{BACSU, GEOKA} против {CLOTE, LACAC, LACLM, LISMO, STAA1},

{BACSU, GEOKA, LISMO} против {CLOTE, LACAC, LACLM, STAA1}.

6.

Филогенетические деревья по выравниванию можно получить и, воспользовавшись сервисом TreeTop НИИФХБ имени А.Н. Белозерского. Результаты выдаются на сайте и отправляются на почту. Представлены параметры алгоритма, выравнивание, деревья в текстовом и графическом форматах, скобочные формулы и матрица расстояний.

Получила два дерева для выравнивания исследуемых бактерий - одно построено по кластерному, другое по топологическому алгоритму. Первое соответствует дереву, полученному с помощью Average Distance Using BLOSUM62. Нетривиальные ветви второго дерева совпадают с ветвями правильного дерева, но его внешний вид не внушает доверия.

Удобно, что сервер сразу выдает графическое изображение деревьев, плюс, вдруг кому-то могут понадобиться деревья в текстовом формате. Но не думаю, что кто-то пользуется данным сервером, и страничка для запросов последний раз обновлялась в 2001 году.


© Eugenia Prokhorova 2011