Геномное окружение. База данных STRING.

Цель данного задания - описать ту информацию, которую база данных STRING может дать относительно выбранного белка. В качестве объекта изучения был взят белок β-глюкозидаза бактерии Thermotoga neapolitana, который рассматривался ранее.
В базе данных STRING содержится инофрмация о взаимодействии белков друг с другом. На рисунке 1 представлен граф белков, связанных с исследуемым белком на первом уровне близости.


Рисунок 1. Граф взаимодействия для первого уровня близости. bglB - исследуемый белок. Зеленые связи обозначают соседнее расположение генов в геноме; желтые - совместное упоминание белков в абстрактах статей в PubMed; синие - совместную встречаемость белков в геномах; голубые - взаимодействие, белков, подтвержденное в базах данных; сиреневые - гомологичность белков. Информация о связанных белках представлена в таблице 1.

Таблица 1. Белки, связанные с исследуемым белком на первом уровне.
Идентификатор Название Функция
lamA laminarinase
(beta-glucanase)
бета-глюканаза
расщепление некрахмальных полисахаридов, например, гемицеллюлозы
CTN_1550 alpha-glucosidase
альфа-глюкозидаза
(мальтаза)
расщепление дисахаридов, например, сахарозы или мальтозы
CTN_1079 beta-fructosidase
бета-фруктозидаза
(инвертаза)
расщепление сахарозы
CTN_1519 endoglucanase
эндоглюканаза
расщепление глюкозидных связей, удаленных от конца цепи
CTN_1518 endoglucanase
эндоглюканаза
расщепление глюкозидных связей, удаленных от конца цепи
Видно, что все ферменты катализируют расщепление ди- или полисахаридов. Данные белки не образуют белковых комплексов, но выполняют схожие функции, и могут последовательно катализировать реакции расщепления полисахаридов.
С помощью базы данных STRING было получено геномное окуржение, представленное на рисунке 2.


Рисунок 2. Геномное окружение (genome neighborhood) β-глюкозидазы с точностью до филума. Цвет белков соответствует цветам на рисунке 1. С полным раскрытым деревом можно ознакомиться здесь.

Видно, что ген исследуемого белка иногда встречается по соседству с геном бета-глюканазы, реже встречается по соседству с геном альфа-глюкозидазы. В целом такие потенциальные опероны встречаются довольно редко и только у отдельных видов. С помощью базы данных STRING получен график "совместной встречаемости" (co-occurrence) с точностью до филума для β-глюкозидазы, рисунок 3.


Рисунок 3. График "совместной встречаемости" (co-occurrence) с точностью до филума для β-глюкозидазы. Ветвь, ведущая к организму T. neapolitana специально показана в развернутом виде. Насыщенность цвета квадрата на графике отражает степень гомологичности белкам исследуемого организма. Полнота (от треугольника к квадрату) квадрата отражает встречаемость соответствующего белка (или его гомолога) в таксоне.

Видно, что белки достаточно часто встречаются вместе, но тем не менее, мне кажется, этого недостаточно для того, чтобы предполагать их участие в каком-то опероне или в формировании белкового комплекса, так как эти ферменты катализируют параллельные, часто независимые, реакции. Кроме того, эти ферменты обеспечивают жизненно важные реакции расщепления полисахаридов, свойственные всем живым клеткам, поэтому их гомологи встречаются практически у всех живых организмов: не только у бактерий, но так же и среди эукариотов и архей.


© Наталья Ланина
e-mail: n.lanina@fbb.msu.ru

последний раз обновлялось: 17.11.15