Филогенетические деревья -IV
Построение дерева по нуклеотидным последовательностям
Таблица 1. Информация о генах 16s РНК из некоторых фирмикут
Название | Мнемоника | AC записи EMBL | Координаты 16S rRNA | Цепь (прямая/обратная) |
Bacillus anthracis | BACAN | AE017225 | 9336..10845 | прямая |
Clostridium tetani | CLOTE | AE015927 | 8715..10223 | обратная |
Enterococcus faecalis | ENTFA | AE016830 | 3168516..3170037 | обратная |
Lactococcus lactis | LACLM | AM406671 | 511423..512971 | прямая |
Lactobacillus acidophilus | LACAC | CP002559 | 447399..448973 | прямая |
Listeria monocytogenes | LISMO | CP006594 | 59255..60807 | обратная |
Staphylococcus epidermidis | STAES | CP000029 | 105734..107287 | прямая |
С помощью программы seqret из пакета EMBOSS были получены последовательности 16s рРНК из указанных выше бактерий, затем построено множественное выравнивание программой MUSCLE (онлайн-сервис), и дерево по нему алгоритмом Maximum likelyhood (рис. 1). Как и в деревьях, строившихся по белковым последовательностям, здесь есть только одна правильная ветвь: {BACAN, STAES, LISMO}vs{other}.
Рис. 1. Филогенетическое дерево некоторых фирмикут по 16s rRNA.
Построение и анализ дерева, содержащего паралоги
Были получены последовательности гомологов белка CLPX_BACSU из выбранных бактерий (blastp,порог по e-value 0.001). Эти белки являются АТФ-зависимыми протеазами или входят в белковый комплекс, выполняющий такую же функцию. Две последовательности из выдачи blastp были исключены, хотя и были из BACAN, т.к. являются идентичными и кодируются в одном месте генома.
Список идентификаторов отобранных гомологов:
B0AWL5_BACAN CLPX_BACAN CLPX_LISMO CLPX_STAES CLPX_CLOTE CLPX_ENTFA CLPX_LACLM HSLU_LACAC HSLU_ENTFA HSLU_STAES HSLU_BACAN HSLU_LISMO CLPC_STAES Q5FKR6_LACAC Q890L5_CLOTE A2RIW9_LACLM Q899V4_CLOTE Q8Y8B1_LISMO Q8YAB6_LISMO Q5FM98_LACAC Q5FHW6_LACAC Q82YZ7_ENTFA Q899H3_CLOTE Q891B9_CLOTE Q837W9_ENTFAЗатем было построено множественное выравнивание (MUSCLE, онлайн-сервис), а по нему - дерево алгоритмом Maximum likelyhood (Рис.2). Видно, что белки образуют как минимум четыре паралогичных кластера с дальнейшим дроблением на паралоги на некоторых ветвях. К сожалению, ни один ортологичный кластер не является достаточно полным для того, чтобы сравнить его с правильным деревом.
Рис. 2. Филогенетическое дерево дерево гомологов белка CLPX_BACSU.
Один из примеров ортологичных белков обозначен красным, паралогов - синим, предполагаемой дупликации гена - голубой звёздочкой.
Ортологичными считаем последовательности, разделившиеся вследствии видобразования.