Практикум 11. Гомология и выравнивание

Для работы было выбрано семейство сенсорных доменов гистидинкиназы.

AC:PF18698
ID:HisK_sensor
Summary name:Histidine kinase sensor domain
Seed:99
Full:374
Structures:4
Species:338
Architectures:10

Гистидинкиназы являются первым звеном двухкомпонентной системы регуляции - важнейшего механизма, благодаря которому клетки могут ощущать изменения в окружающей среде и отвечать на них. При наличии какого-то внешнего стимула гистидинкиназа фосфорилирует другой белок, который является транскрипционным фактором. Он связывается с регуляторным участком нужного гена и активирует его транскрипцию.

Рассматриваемая гистидинкиназа - ResE - реагирует на пониженное содержание кислорода и налиие оксида азота NO и фосфорилирует белок ResD, который активирует гены, ответственные за нитратное дыхание. ResE состоит из нескольких доменов. Сенсорный домен находится на N-конце. Он включает в себя два трансмембранных учатков и петили, расположенной во внешней среде. Эти участки фиксируют изменения содержания кислорода.

Почти все белки семейства найдены у бактерий из порядка Bacillales и других представителей группы Фиримикут. Однако одна последовательность, содержащая домен HisK_sensor найдена у тли Acyrthosiphon pisum. У нее этот домен находится на С-конце белка, который не является гистидинкиназой (см. рис. 1). Возможно тля получила эту последовательность в результате горизонтального переноса. У этих тлей были найдены гены, полученные от симбиотических бактерий.

?

Рисунок 1. Наиболее распространенные архитектуры белков (верхние 3) и архитектура белка тли (самая нижняя).

Выравнивания

Выравнивание было покрашено с помощью Clustal и по проценту идентичности .

При раскрашивании с помощью Above identity threshold с порогом 100% не было обнаружено ни одного консервативного для всех последовательностей остатка. То есть максимально достоверного блока, включающего все последовательности, нет.

При пороге 90% раскрасились только 13 и 132 позиции. При раскрашивании с порогом 50% было выбрано 26 позиций, то есть 16% от всех аминокислотных остатков

Выбранный максимальный блок образован последними десятью аминокислотными остатками (150-159). Он включает в себя 38 последоваетльностей из 99. Из 10 аминокислотных остатков 5 полностью функционально консервативны, а на других позициях у некоторых последовательностей есть несовпадения.

Достоверные блоки отсутствуют на участках с 26 по 37, с 66 по 76, со 134 по 148. Там очень много гэпов и наблюдаются только случайные совпедания аминокислотных остатков.

В выравнивании учаcтки, содержащие достоверные блоки, выделены красным.

Сравнение разных архитекутр

Две из трех наиболее распространенных архитектур отличаются только тем, что в первой есть домен PAS, а во второй - PAS_4 (см. рис. 1). Поэтому интересно было сравнить, насколько они отличаются друг от друга. При поиске последовательностей через Jalview в неоторых из них домены выделились цветом: исходная выдача праграммы. После выравнивания домен PAS оказался между 290 и 230 позициями. Все последовательности имеют очень большое сходство. При всех разделить последовательности на группы белки в одну и ту же группу попадали белки с разной архитектурой. Это говорит о том, что домены PAS и PAS_4 гомологичны. PAS_4 является частным случаем PAS. Вероятно, для первой группы домен просто указан менее конкретно.