Филогенетические деревья -IV

Построение дерева по нуклеотидным последовательностям

Таблица 1. Информация о генах 16s РНК из некоторых фирмикут

Название Мнемоника AC записи EMBL Координаты 16S rRNA Цепь (прямая/обратная)
Bacillus anthracis BACAN AE017225 9336..10845 прямая
Clostridium tetani CLOTE AE015927 8715..10223 обратная
Enterococcus faecalis ENTFA AE016830 3168516..3170037 обратная
Lactococcus lactis LACLM AM406671 511423..512971 прямая
Lactobacillus acidophilus LACAC CP002559 447399..448973 прямая
Listeria monocytogenes LISMO CP006594 59255..60807 обратная
Staphylococcus epidermidis STAES CP000029 105734..107287 прямая

С помощью программы seqret из пакета EMBOSS были получены последовательности 16s рРНК из указанных выше бактерий, затем построено множественное выравнивание программой MUSCLE (онлайн-сервис), и дерево по нему алгоритмом Maximum likelyhood (рис. 1). Как и в деревьях, строившихся по белковым последовательностям, здесь есть только одна правильная ветвь: {BACAN, STAES, LISMO}vs{other}.



Рис. 1. Филогенетическое дерево некоторых фирмикут по 16s rRNA.

Построение и анализ дерева, содержащего паралоги

Были получены последовательности гомологов белка CLPX_BACSU из выбранных бактерий (blastp,порог по e-value 0.001). Эти белки являются АТФ-зависимыми протеазами или входят в белковый комплекс, выполняющий такую же функцию. Две последовательности из выдачи blastp были исключены, хотя и были из BACAN, т.к. являются идентичными и кодируются в одном месте генома.

Список идентификаторов отобранных гомологов:

B0AWL5_BACAN
CLPX_BACAN
CLPX_LISMO
CLPX_STAES
CLPX_CLOTE
CLPX_ENTFA
CLPX_LACLM
HSLU_LACAC
HSLU_ENTFA
HSLU_STAES
HSLU_BACAN
HSLU_LISMO
CLPC_STAES
Q5FKR6_LACAC
Q890L5_CLOTE
A2RIW9_LACLM
Q899V4_CLOTE
Q8Y8B1_LISMO
Q8YAB6_LISMO
Q5FM98_LACAC
Q5FHW6_LACAC
Q82YZ7_ENTFA
Q899H3_CLOTE
Q891B9_CLOTE
Q837W9_ENTFA
Затем было построено множественное выравнивание (MUSCLE, онлайн-сервис), а по нему - дерево алгоритмом Maximum likelyhood (Рис.2). Видно, что белки образуют как минимум четыре паралогичных кластера с дальнейшим дроблением на паралоги на некоторых ветвях. К сожалению, ни один ортологичный кластер не является достаточно полным для того, чтобы сравнить его с правильным деревом.




Рис. 2. Филогенетическое дерево дерево гомологов белка CLPX_BACSU.

Один из примеров ортологичных белков обозначен красным, паралогов - синим, предполагаемой дупликации гена - голубой звёздочкой.
Ортологичными считаем последовательности, разделившиеся вследствии видобразования.