Учебная страничка Васюткиной Ольги

Построение дерева по нуклеотидным последовательностям

Из файлов .frn в директории каждой выбранной в предыдущей работе бактерии на ftp NCBI были получены последовательности 16S рРНК.
Файл с полученными последовательностями: загрузить

Последовательности были выровнены с помощью Muscle. Выравнивание: загрузить.

По данному выравниванию в программе MEGA с помощью алгоритма Neighbor-Joining с количеством бутстрэп-реплик 100 было построено дерево (рис. 1).

Судя по выравниванию и длинам ветвей, последовательности 16S рРНК у всех данных организмов практически идентичны. Однако построенное дерево отличается от правильного: в построенном есть нетривиальная ветвь, отделяющая STRP1, STRPN, ENTFA, BACAN, GEOKA от LACAC, CLOTE, CLOB1. Стоит отметить, что в предыдущей работе, где дерево строилось по белковым последовательностям, различие полученного дерева с правильным было тоже в расположении ветви LACAC.

Рис. 1

Рис. 1. Филогенетическое дерево по выравниванию 16S рРНК. Указаны длины и количества бутстрэп-реплик для каждой ветви

Построение и анализ дерева, содержащего паралоги

Вначале в протеомах выбранных бактерий были найдены достоверные (E-value < 0.001) гомологи белка CLPX_BACSU. Последовательности были выровнены с помощью Muscle. По данному выравниванию в программе MEGA с помощью алгоритма Neighbor-Joining с количеством бутстрэп-реплик 100 было построено дерево (рис. 2).

На рисунке 2 выделены рамками две группы ортологов, причем в красной рамке - поддерево, по топологии сооответствующее правильному дереву, за исключением, опять же, расположением ветви LACAC. Вторая группа ортологов, видимо, получилась в ходе изменения функции гена в результате видообразования. Также на рисунке 2 выделены две группы паралогов. Скорее всего, их появление произошло из-за дупликации гена. Причем у организма CLOTE произошло две последовательные дупликации.

Рис. 2

Рис. 2. Филогенетическое дерево, содержащее паралоги. Указаны количества бутстрэп-реплик для каждой ветви. Рамками выделены группы ортологичных белков, синим цветом - паралоги.


Valid HTML 4.01 Transitional