Построение и анализ дерева, содержащего паралоги


С помощью web-сервиса Protein Blast был проведён поиск гомологов белка CLPX_ECOLI в протеомах бактерий ECOLI, ACICJ, PASMU, NEIMA, PARDP, SACD2, SHEDO. Было найдено 26 гомологов. Далее, используя JalView с помощью программы muscle было построено множественное выравнивание найденных гомологов. Потом выранивание было открыто программой MEGA7 и там было построено филогенетическое дерево по алгоритму максимального правдоподобия. Получившееся дерево приведено ниже.

Сиреневым и фиолетовым отмечены ортологи CLPX и HSLU. Отдельно выделен CLPX_NEIMA, так как ветвь, ведущая от группы белков CLPX к данному белку не является тривиальной и cуществует такое разрешение этого дерева, чтобы этот белок оказался в одной группе с остальными белками CLPX. CLPX - АТФ-связывающая субъединица ClpX АТФ-зависимой протеазы Clp. HSLU - АТФазная субъединица HslU АТФ-зависимой протеазы. Так как оба белка присутствуют во всех организмах одновременно, то происходившие эволюционные события могли быть такими: сначала произошла дупликация гена, а затем разделение путей их эволюции.
Красным цветом отмечены паралоги PASMU, оранжевым - PARDP, жёлтым - паралоги ECOLI.
Рассмотрим, например, паралоги ECOLI: CLPX, CLPA, FTSH, HSLU. CLPA - АТФ-связывающая субъединица ClpA АТФ-зависимой протеазы ClpAP. FTSH - АТФ-зависимая цинк-металлопротеаза FtsH. Как видно, все паралоги белка CLPX_ECOLI кодируют АТФ-зависимые пептидазы или их субъединицы. Следовательно, в данном случае тоже проиходила дупликация генов и разделение путей их дальнейшей эволюции: они начинали входить в разные протеазные комплексы или кодировать самостоятельные протеазы.
Стоит отметить, что, например, RUVB_PARDP и FTSH_ECOLI будут являться ортологами, так как они присутсвуют в разных организмах и разделение путей эволюции белков соответсвует разделению путей эволюции самих организмов.

©Кондратенко Наталья, 2017