Построение и анализ дерева, содержащего паралоги
Для выполнения задания в выбранных ранее бактериях были найдены достоверные
гомологи белка CLPX_ECOLI. Для этого протеомы этих организмов были
объединены в один файл, который был использован для создания базы данных. В
результат поиска было найдено 24 гомологичных белка. Затем с помощью
сервиса Uniprot был получен файл, содержащий аминокислотные
последовательности указанных белков. Последовательности были выровнены с
помощью программы muscle. Дерево этих гомологов было реконструировано в
программе MEGA методом UPGMA.
Рисунок 1. Изображение дерева гомологов CLPX_ECOLI
Гомологичные белки будем называть ортологами, если они: а) из разных
организмов; б) разделение их общего предка на линии, ведущей к ним,
произошло в результате видообразования.
Два гомологичных белка из одного организма будем называть паралогами.
Анализ полученного дерева:
Можно предположить, что у предка представленных организмов (ECOLI, PASMU,
RALSO, BURCA, RHIEC, RHOS4, SALTY) произошла дупликация гена: одна его
копия стала CLPX, а другая - HSLU. У RHIEC
также вероятно произошла дупликация гена, в результате чего у этого
организма появились белки Q2K4M2 и Q8KKT3.
В качестве примера разделения путей эволюции белков в результате
видообразования могут быть указаны ветви, ведущие к группам
белков-гомологов CLPX и HSLU.