Практикум 4
Среди представленных организмов я выбрала 8 со следующими мнемониками: HAEIN, PARDP, POLAQ, PSEAE, RHIME, SACD2, SHEDO, YERPE. На основании их протеомов была создана база данных. В этой базе данных сделан запрос по белку CLPX_ECOLI. Результат работы blast с установленным приемлемым e-value можно посмотреть здесь.
По последовтельностям, найденным blast, было построено множественное выравнивание, а на его основении с помощью iqtree реконструировано дерево. Посмотреть Newick форму можно здесь. На рисунке 1 показано реконструировано дерево с уоренением в средную точку. Видно что есть только две довольно однозначные группы белков: CLPX и HSLU. HSLU - субъединица HslU АТФ-зависимой протеазы (ATP-dependent protease ATPase subunit HslU). Она работает в комплексе с субъединицей HslV, обеспечивая энергию, необходимую для разворачивания и транслокации белковых субстратов в протеолитическую камеру. АТФ-зависимая активность HslU позволяет протеазе эффективно разрушать неправильно свернутые или поврежденные белки. CLPX - субъединица, связывающая АТФ, в Clp протеазе (ATP-dependent Clp protease ATP-binding subunit ClpX). Она имеет точно такую же функцию, что и предыдущий белок.
Рис.1 Дерево, реконструированное iqtree
На рисунке 2 показыно дерево, отображающее топологию разделения на две группы. Построено оно путем схлопывания двух клад.
Рис.2 Дерево c объединенными ветвями
На рисунке 1 можно выделить пары паралогов: CLPX_YERPE и HSLU_YERPE, CLPX_SHEDO и HSLU_SHEDO, CLPX_SACD2 и HSLU_SACD2. А так же пары ортологов: CLPX_PSEAE и CLPX_SACD2, CLPX_PARDP и CLPX_RHIME, HSLU_YERPE и HSLU_SHEDO.