Практикум 11. Гомология и выравнивание
Для работы было выбрано семейство сенсорных доменов гистидинкиназы.
AC: | PF18698 |
ID: | HisK_sensor |
Summary name: | Histidine kinase sensor domain |
Seed: | 99 |
Full: | 374 |
Structures: | 4 |
Species: | 338 |
Architectures: | 10 |
Гистидинкиназы являются первым звеном двухкомпонентной системы регуляции - важнейшего механизма, благодаря которому клетки могут ощущать изменения в окружающей среде и отвечать на них. При наличии какого-то внешнего стимула гистидинкиназа фосфорилирует другой белок, который является транскрипционным фактором. Он связывается с регуляторным участком нужного гена и активирует его транскрипцию.
Рассматриваемая гистидинкиназа - ResE - реагирует на пониженное содержание кислорода и налиие оксида азота NO и фосфорилирует белок ResD, который активирует гены, ответственные за нитратное дыхание. ResE состоит из нескольких доменов. Сенсорный домен находится на N-конце. Он включает в себя два трансмембранных учатков и петили, расположенной во внешней среде. Эти участки фиксируют изменения содержания кислорода.
Почти все белки семейства найдены у бактерий из порядка Bacillales и других представителей группы Фиримикут. Однако одна последовательность, содержащая домен HisK_sensor найдена у тли Acyrthosiphon pisum. У нее этот домен находится на С-конце белка, который не является гистидинкиназой (см. рис. 1). Возможно тля получила эту последовательность в результате горизонтального переноса. У этих тлей были найдены гены, полученные от симбиотических бактерий.
Рисунок 1. Наиболее распространенные архитектуры белков (верхние 3) и архитектура белка тли (самая нижняя).
Выравнивания
Выравнивание было покрашено с помощью Clustal и по проценту идентичности .
При раскрашивании с помощью Above identity threshold с порогом 100% не было обнаружено ни одного консервативного для всех последовательностей остатка. То есть максимально достоверного блока, включающего все последовательности, нет.
При пороге 90% раскрасились только 13 и 132 позиции. При раскрашивании с порогом 50% было выбрано 26 позиций, то есть 16% от всех аминокислотных остатков
Выбранный максимальный блок образован последними десятью аминокислотными остатками (150-159). Он включает в себя 38 последоваетльностей из 99. Из 10 аминокислотных остатков 5 полностью функционально консервативны, а на других позициях у некоторых последовательностей есть несовпадения.
Достоверные блоки отсутствуют на участках с 26 по 37, с 66 по 76, со 134 по 148. Там очень много гэпов и наблюдаются только случайные совпедания аминокислотных остатков.
В выравнивании учаcтки, содержащие достоверные блоки, выделены красным.
Сравнение разных архитекутр
Две из трех наиболее распространенных архитектур отличаются только тем, что в первой есть домен PAS, а во второй - PAS_4 (см. рис. 1). Поэтому интересно было сравнить, насколько они отличаются друг от друга. При поиске последовательностей через Jalview в неоторых из них домены выделились цветом: исходная выдача праграммы. После выравнивания домен PAS оказался между 290 и 230 позициями. Все последовательности имеют очень большое сходство. При всех разделить последовательности на группы белки в одну и ту же группу попадали белки с разной архитектурой. Это говорит о том, что домены PAS и PAS_4 гомологичны. PAS_4 является частным случаем PAS. Вероятно, для первой группы домен просто указан менее конкретно.