Сначала я разделила выравнивания по ветвям {CLOTE, CLOB1}, {FINM2, LACAC} и остальные 3 последовательности, т.е.
отделила Clostridium и Bacillaceae от остальных:
Видно, что Clostridium (синие) четко выделяются, поэтому для них диагностическими позициями можно назвать следующие участки:
2-85, 155-233.
Теперь отделим Bacilli от Clostridia, т.е. {LACAC, ENTFA, BACSU, GEOKA} от {CLOTE, CLOB1, FINM2}:
Здесь диагностическими позициями я бы назвала участки:
для Bacilli (зеленый): 4-49, 91-118, 160-179.
для Clostridia (розовый): 2-59, 68-118, 164-231.
Таким образом, построив несколько выравниваний можно предугадать структуру дерева.
На вход было подано полученное выравнивание. Впечатлило, что сервис выдал результат буквально через 3 секунды, даже не пришлось ждать.
Причем сразу было постороено и дерево и матрица расстояний, так что можно не использовать несколько программ для получения того же результата:
Distance Matrix 1 2 3 4 5 6 7 1 RS2_LACAC 0.000 0.355 0.393 0.399 0.303 0.323 0.366 2 RS2_FINM2 0.355 0.000 0.399 0.393 0.361 0.369 0.386 3 RS2_CLOB1 0.393 0.399 0.000 0.112 0.387 0.302 0.251 4 RS2_CLOTE 0.399 0.393 0.112 0.000 0.392 0.306 0.233 5 RS2_ENTFA 0.303 0.361 0.387 0.392 0.000 0.286 0.331 6 RS2_BACSU 0.323 0.369 0.302 0.306 0.286 0.000 0.161 7 RS2_GEOKA 0.366 0.386 0.251 0.233 0.331 0.161 0.000
Помимо того показывается еще алгоритм построения, в том числе и скобочная формула.
Дерево можно представить и в угловой форме:
Минусом, на мой взгляд является то, что в качестве входного файла используется выравнивание, то есть придется привлекать к работе
программы выравнивания.
В целом, сервис мне понравился: достаточно простой, содержит только самое нужное.