Реконструкция филогении
Таксономия отобранных мною бактерий
Таблица 1. Таксономия бактерий | |||
---|---|---|---|
Имя бактерии | Мнемоника | Таксономия | NCBI TaxID |
Brucella suis | BRUSU | Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Brucellaceae; Brucella | 29461 |
Escherichia coli | ECOLI | Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacterales; Enterobacteriaceae; Escherichia | 562 |
Neisseria meningitidis | NEIMA | Bacteria; Proteobacteria; Betaproteobacteria; Neisseriales; Neisseriaceae; Neisseria | 487 |
Paracoccus denitrificans | PARDP | Bacteria; Proteobacteria; Alphaproteobacteria; Rhodobacterales; Rhodobacteraceae; Paracoccus | 266 |
Polynucleobacter asymbioticus | POLAQ | Bacteria; Proteobacteria; Betaproteobacteria; Burkholderiales; Burkholderiaceae; Polynucleobacter | 576611 |
Saccharophagus degradans | SACD2 | Bacteria; Proteobacteria; Gammaproteobacteria; Cellvibrionales; Cellvibrionaceae; Saccharophagus | 86304 |
Serratia proteamaculans | SERP5 | Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacterales; Yersiniaceae; Serratia | 28151 |
Thiobacillus denitrificans | THIDA | Bacteria; Proteobacteria; Betaproteobacteria; Nitrosomonadales; Thiobacillaceae; Thiobacillus | 36861 |

Выравнивание белков
Для этого задания я выбрал белок 16S рРНК-метилтрансферазу H с мнемоникой RSMH, так как она больше всех мне понравилась.
Выравнивание этого белка из разных бактерий, приведённых в Таблице 1, я построил с помощью программы JalView, используя алгоритм
Собственно реконструкция филогении
Строил филогенетическое дерево белков я с помощью трёх методов: UPGMA, Neighbor-Joining, а также с помощью метода максимальной экономии (Maximum Parsimony). Ниже приведены получившиеся деревья:

Как мы можем заметить, ближе всех к правильному дереву оказалось дерево с рис. 2, построенное методом Neighbor-Joining (2 неправильные ветви). Думаю, что это можно объяснить таким образом:
- Во-первых, метод UPGMA, строя филогенетическое древо, подразумевает, что работают молекулярные часы. Но вот нам достоверно не известно, работают ли молекулярные часы по отношению к нашим белку и бактериям, или нет, они там могут и не работать, или работать с погрешностью (если я правильно понимаю, о чём говорю). И я думаю, что именно поэтому UPGMA ошибся в построении филогенетического древа (3 неправильные ветви);
- Во-вторых, метод максимальной экономии сам по себе был сделан, как метод грубой быстрой оценки, в угоду скорости, так что скорее всего именно поэтому его дерево оказалось достаточно далеко от референса (3 неправильные ветви);
Полученные деревья в формате