Функциональная роль гена в подсистеме, GO, SEED



1.

Данный мне белок - AC A3NKW4.

В аннотации к нему были найдены следующие данные:


GO; GO:0005737; C:cytoplasm; IEA:InterPro.
GO; GO:0030257; C:type III protein secretion system complex; IEA:InterPro.
GO; GO:0005524; F:ATP binding; IEA:InterPro.
GO; GO:0046961; F:proton-transporting ATPase activity, rotational mechanism; IEA:InterPro.
GO; GO:0006754; P:ATP biosynthetic process; IEA:InterPro.
GO; GO:0030254; P:protein secretion by the type III secretion system; IEA:InterPro.

Прежде всего, даже по мотивам, найденным в белке blast-ом, можно предположить его функцию:

Большинство найденных в uniprot гомологов - АТР-синтазы и имеют очень схожие данные в GO.

По locus name белок был найден в KEGG (ссылка). Данный белок участвует в системе секреции бактерий:

А точнее, в "type III secretion system" - одной из систем секреции, которая принимает участие в опознавании эукариотических клеток рядом с бактерией и выделении веществ для их инфецирования.

2.

Расшифровка терминов GO, связанных с белком и системой (что одно и то же, на самом деле, термины GO достаточно хорошо описывают роль и локализацию белка):


C:cytoplasm All of the contents of a cell excluding the plasma membrane and nucleus, but including other subcellular structures. Локализация в цитоплазме (полное определение цитоплазмы - это неожиданно)
C:type III protein secretion system complexA complex of approximately 20 proteins, most of which are located in the cytoplasmic membrane that carries out protein secretion in the bacterial type III secretion system; type III secretion also requires a cytoplasmic, probably membrane-associated ATPase.Является частью комплекса бактериальной системы секреции типа III (как и говорилось выше)
F:ATP bindingInteracting selectively and non-covalently with ATP, adenosine 5'-triphosphate, a universally important coenzyme and enzyme regulator.Коротко - связывает АТР
F:proton-transporting ATPase activity, rotational mechanismCatalysis of the transfer of protons from one side of a membrane to the other according to the reaction: ATP + H2O + H+(in) = ADP + phosphate + H+(out), by a rotational mechanism.Имеет протон-транспортную АТРазную активность, причем засчет "роторного" механизма, как в изученных АТР-синтазах (что подсказывает, что это АТР-синтаза и есть)
P:ATP biosynthetic processThe chemical reactions and pathways resulting in the formation of ATP, adenosine 5'-triphosphate, a universally important coenzyme and enzyme regulator. Участвует в синтезе АТР
P:protein secretion by the type III secretion systemThe process in which proteins are transferred into the extracellular milieu or directly into host cells by the bacterial type III secretion system; secretion occurs in a continuous process without the distinct presence of periplasmic intermediates and does not involve proteolytic processing of secreted proteins.Коротко - белок бактериальной системы секреции типа III, с помощью которой инфецируются клетки хозяина

3.

Использовалась бд STRING, так как в момент выполнения практикума SEED работать отказывалась.


При запросе в STRING нужного белка бд сразу же показывает его предполагаемых функциональных партнеров, то есть белки, участвующие совместно с ним. На схемах ниже данный мне белок обозначен как sctN.


В принципе, STRING сразу делает все, что нужно, за нас. "Предполагаемые функциональные партнеры" вычисляются с помощью сопоставления данных о соседстве данных генах, их встречаемости в различных организмах, ко-экспрессии, экспериментальных данных и информации из баз данных и так далее. Если перейти на вкладку "Occurence", можно узнать, с какими другими белками чаще всего встречается данный. К сожалению, я не нашла, как выбирать отдельные организмы, поэтому привожу более или менее "сокращенную" (то есть родственные виды объединены), но не слишком, таблицу:

Наличие белка в организме или группе организмов обозначается на схеме квадратиком, цвет которого соотносится с консервативностью последовательности. Угол квадратика другого цвета обозначает минимальную консервативность белков в группе организмов. Я не очень понимаю, как можно делать какие-то глобальные выводы из этой таблицы, так как, например, adk (аденилат киназа) и данный sctN встречаются почти везде, но это может не значить, что они связаны: у них как раз какой-либо закономерности не видно. С другой стороны, из этой же таблицы можно заключить о связи sctT и sctJ (например), они явно встречаются вместе. Видимо, STRING умнее, потому что в сводной таблице (см. ниже), где она оценивает связь выбранных белков и данного сразу по многим параметрам, она учитывает все правильно. Например, тот же adk "очков" за occurence не получает.


Также предоставляется информация об окресностях гена (данный, sctN, изначально изображается красной стрелкой). Этого гена вообще нет в некоторых группах организмов, например эукариот и архей. Видно, что почти всего он, если он вообще есть, колокализован с fliG (темно-зеленый) и sctJ (светло-зеленый, семейство FliF). Реже, но все равно более или менее закономерно встречается группа генов fliN (голубой), BURPS668_033 (FliQ, фиолетовый), sctT (FliR, оранжевый) и flhB (розовый).

Часть данных STRING берет из других баз. В соответствующем разделе можно посмотреть, к каким системам относится данный белок. Там верно определяется бактериальная секреторная система из KEGG (в нее входят, кроме sctN, найденные sctT, sctJ и другие). Кроме того, находится некий "de novo биосинтез аденозиновых нуклеотидов" из BioCyc/EcoCyc Pathways. Именно оттуда взят белок adk (аденилат киназа), который приведен в сводной балице STRING (см. ниже), но не встречается больше нигде.


На основе анализа всего-всего STRING составляет вышеупомянутую сводную таблицу:

По ней видно, что adk, например, вряд ли входит в нужную нам систему III секреции бактерий, тем более что ранее мы уже видели, что он действительно входит в другую систему. Что касается других белков из этой таблицы, то часть их них входит в ту самую bacterial secretion system, а часть - во flagellar assembly. Осталось только выяснить, как эти две системы связаны вообще и при чем тут sctN.


При более тщательном изучении A3NKW4 в uniprot обнаружилось, что он на самом деле обозначается в базах данных как член семейства FliI - флагелло-зависимых АТР синтаз. И FliI уже есть на карте флагеллярного ансамбля:

По данным сводной таблицы STRING рисует итоговую "сеть" белков, по которой видны все наши выводы. Я условно выделила на ней обе системы, хотя связь между различными белками разных систем тоже явно видна. adk не относится ни к одной из них, как было выяснено раньше.