Практикум 4

1. Поиск гомологичных последовтельнсотей

Среди представленных организмов я выбрала 8 со следующими мнемониками: HAEIN, PARDP, POLAQ, PSEAE, RHIME, SACD2, SHEDO, YERPE. На основании их протеомов была создана база данных. В этой базе данных сделан запрос по белку CLPX_ECOLI. Результат работы blast с установленным приемлемым e-value можно посмотреть здесь.

2. Построение деревьев

По последовтельностям, найденным blast, было построено множественное выравнивание, а на его основении с помощью iqtree реконструировано дерево. Посмотреть Newick форму можно здесь. На рисунке 1 показано реконструировано дерево с уоренением в средную точку. Видно что есть только две довольно однозначные группы белков: CLPX и HSLU.
HSLU - субъединица HslU АТФ-зависимой протеазы (ATP-dependent protease ATPase subunit HslU). Она работает в комплексе с субъединицей HslV, обеспечивая энергию, необходимую для разворачивания и транслокации белковых субстратов в протеолитическую камеру. АТФ-зависимая активность HslU позволяет протеазе эффективно разрушать неправильно свернутые или поврежденные белки.
CLPX - субъединица, связывающая АТФ, в Clp протеазе (ATP-dependent Clp protease ATP-binding subunit ClpX). Она имеет точно такую же функцию, что и предыдущий белок.

tree

Рис.1 Дерево, реконструированное iqtree

На рисунке 2 показыно дерево, отображающее топологию разделения на две группы. Построено оно путем схлопывания двух клад.

tree

Рис.2 Дерево c объединенными ветвями

На рисунке 1 можно выделить пары паралогов: CLPX_YERPE и HSLU_YERPE, CLPX_SHEDO и HSLU_SHEDO, CLPX_SACD2 и HSLU_SACD2. А так же пары ортологов: CLPX_PSEAE и CLPX_SACD2, CLPX_PARDP и CLPX_RHIME, HSLU_YERPE и HSLU_SHEDO.