Геномное окружение. База данных STRING С помощью базы данных STRING можно определить белки, с которыми связан (взаимодействует) исследуемый белок. Белок Rhodanese бактерии Azotobacter vinelandii DJ имеется в базе данных STRING (ген rhdA), поиск проводился на основе названия белка и организма, которому он принадлежит. На рис. 1 можно увидеть граф взаимодействий этого белка с белками, связанными с ним на первом уровне близости. Рис. 1. Изображение "графа взаимодействий" белка Rhodanese бактерии Azotobacter vinelandii DJ и других белков (связанных с Rhodanese на первом уровне близости) в режиме evidence. Зелёным цветом покрашены рёбра графа, соединяющие белки, взаимодействие между которых определено на основе соседства их генов, красным - на основании сшивки генов, сиреневым - на основе экспериментальных данных, бирюзовым - на основе информации из базы данных, желтым - на основе литературных данных. Изображение получено с помощью базы данных STRING. Белок Rhodanese взаимодействует с пятью белками, информацию о которых можно увидеть в таблице 1. Таблица 1. Информация о белке Rhodanese бактерии Azotobacter vinelandii DJ и его окружении.
Данные белки не входят в один белковый комплекс и не катализируют последовательные реакции одного метаболического пути. Белки, кодируемые генами rhdA, nifS и iscS участвуют в метаболизме серы, причём nifS и iscS катализируют одну и ту же реакцию (2.8.1.7) по данным KEGG, имеют практически одинаковые названия и имеют одну и ту же функцию. Белок, кодируемый в локусе Avin_21440 и белок, кодируемый геном metC участвуют в метаболизме аминокислот. Получена информация о геномном окружении гена белка Rhodanese бактерии Azotobacter vinelandii DJ. Дерево с информацией о геномном окружении с точностью до филума можно увидеть на рис. 2. Полное дерево можно скачать здесь. Рис. 2. "Геномное окружение" (genome neighborhood) для белка Rhodanese бактерии Azotobacter vinelandii DJ с точностью до филума. "Полоски" красного цвета соответствуют гену rhdA (Роданеза), зелёные - metC (Цистатионин бета-лиаза), жёлтые - psd (Фосфатидилсерин декарбоксилаза), бирюзовые - iscS (Цистеин десульфураза), синие - Avin_21440 (Аспартат аминотрансфераза), сине-сиреневые - nifS (Цистеин десульфураза фиксации азота). Изображение получено с помощью базы данных STRING. Найденные белки встречаются рядом только у бактерий (для архей и эукариот совместная встречаемость не выявлена). На общем дереве можно видеть, что гены rhdA и psd находятся рядом у некоторого количества гамма-протеобактерий (особенно у родов Pseudomonas и Actinobacter), из чего можно предположить, что они входят в один оперон. Также, гены rhdA и metC расположены рядом в геномах некоторых альфа-протеобактерий, что аналогично даёт возможность предполагать, что у этих организмов они включены в один оперон. Также, для этих двух пар есть примеры сшивок, это является ещё одним доводом к выводу об их включении в опероны, а также из этого можно предполагать, что у некоторых организмов эти белки могут быть ассоциированы. Получен график "совместной встречаемости" (co-occurrence) для белка Rhodanese бактерии Azotobacter vinelandii DJ, который с точностью до филума предствален на рис. 3. Рис. 3. График "совместной встречаемости" (co-occurrence) для белка Rhodanese бактерии Azotobacter vinelandii DJ с точностью до филума. Изображение получено с помощью базы данных STRING. Чем темнее квадратик на графике совместной встречаемости, тем белок таксона более гомологичен одному из наших белков. Полнота квадратика отражает встречаемость соответствующего белка (или его гомолога) в таксоне. Поэтому, неполные тёмные квадратики в строке, соответствующей протеобактериям (к которым и относится наша бактерия Azotobacter vinelandii DJ) означают, что найденные у протеобактерий белки гомологичны нашим (что логично, т. к. найденные белки как раз и являются белками протеобактерии Azotobacter vinelandii DJ), но эти белки присутствуют только у части протеобактерий, а у остальных эти белки отсутствуют. Исходя из рис. 3 гомологи (хоть и разной достоверности) всех шести белков присутствуют во многих таксонах. Это бактерии классов Proteobacteria, Firmicutes, Actinobacteria, Cyanobacteria, Spirochaetales, Fusobacteriaceae и др., эукариотические организмы классов FungiMetazoa group, Viridiplantae, Stramenopilus, Amoebozoa, Trypanosomatidae. Причём гомологи белков, кодируемые генами iscS, Avin_21440, nifS распространены во всех таксонах, поэтому говорить о существовании паттерна совместной встречаемости этих белков с rhdA нельзя. Для psd и metC также не прослеживается наличие совместной встречаемости с rhdA. Т. к. ранее было выяснено, что функции белков различаются (rhdA, iscS, nifS задействованы в метаболизме серы, metC, Avin_21440 - в метаболизме аминокислот, а psd - в метаболизме глицерофосфолипидов), данные белки не являются частью одного процесса. Однако, интересно, что совместная встречаемость iscS и nifS коррелирует с наличием сходной функции у этих белков (тоесть можно считать, что эти два белка вовлечены в один процесс). То, что во многих таксонах эти шесть белков присутствуют одновременно скорее связано с тем, что они участвуют в достаточно важных процессах в организме.
© Shvetsova Ekaterina, FBB MSU, 2013 |