Учебный сайт Макаровой Надежды

Третий семестр

STRING

В данном задании требовалось проверить консервативность геномного окружения гена ygiA (идентификатор S3281), кодирующего hypothetical protein из организма Shigella flexneri 2a str. 2457T.

Использовалась БД STRING.

Самого белка в базе данных не оказалось, поэтому с помощью опции "search by protein sequence" был найден ближайший гомолог - ECD_02908 из бактерии Escherichia coli BL21DE3 (Query cover = 100%, е-value = 0.0, ident = 100%).

На графе взаимодействий данного белка были показаны белки, находящиеся с данным на первом уровне близости (см. рис. 1). На рис. 2 изображена легенда изображения. Как видно из легенды, функционально белки различаются довольно сильно. Существуют отдельные пары-тройки функционально схожих белков.

Рисунок 1. Белки, находящиеся на первом уровне близости с белком ECD_02908. Зеленым обозначены связи Neighborhood - белки, входящие в консервативное окружение данного белка, синим - "Cooccurrence" - белки, встречающиеся с ним в одних организмах.

Рисунок 2. Информация о белках.
\
Таблица 1. Информация о белке ECD_02908 и его окружении.
Название гена Идентификатор белка KEGG STRING Номер оперона
ygiA ECD_02908 гипотетический белок белок 590813
ygiC ECD_02910 Глутатионилспермидинсинтаза гипотетический белок590813
ygiB ECD_02909 Консервативный белок наружной мембраны белок наружной мембраны 590813
tolC ECD_02907 канальный белок наружной мембраны; участник множества транспортных систем, которые включены в систему вывода антибиотиков и токсинов из клетки. Белок наружной мембраны предшественник канала 590813
nudF ECD_02906 АДФ-рибоза пирофосфатаза АДФ-рибоза пирофосфатаза 590812
yqiB ECD_02905 Предсказанная дегидрогеназа Дегидрогеназа 590812
icc ECD_02904 cAMP фосфодиэстераза cAMP фосфодиэстераза. Играет важную регуляторную роль в модуляции внутриклеточной концентрации цАМФ, влияя тем самым на цАМФ-зависимые процессы 590812
yqiA ECD_02903 Эстераза Эстераза 590812
parE ECD_02902 ДНК топоизомераза IV субъединица В ДНК топоизомераза IV субъединица В 590812

Далее была получена информация о геномном окружении выбранного белка. На рис.3 приведено дерево организмов, в котором встречаются найденные белки с точностью до филума.

Рисунок 3. Геномное окружение белка ECD_02908 с точностью до филума.

Все встречаются рядом только в одном организме - бактерии Escherichia coli BL21DE3, откуда и взят исходный белок для анализа. Поэтому говорить о совместной встречаемости данных белков затруднительно.

Далее был получен график совместной встречаемости гомологов найденных белков с точностью до филума (рис. 4.). Результаты позволяют предположить, что данный набор белков редко встречается среди организмов всех трех доменов(цвет "квадратика" показывает, наиболее близкого гомолога в данном таксоне, "полнота" собственно фигур до квадратов обозначает распространненость белка среди представителей данного таксона).

Рисунок 4. График совместной встречаемости гомологов найденных белков с точностью до филума..

Далее с помощью DOOR был найден оперон, в состав которого входит ген ygiA, кодирующий наш неизвестный белок. Изображение оперона представлено на рисунке 5. Оказалось, что гены, найденные программой String Принадлежат двум разным оперонам. И это разделение соответствует функциональному. (см. Таблица 1)

Рисунок 4. Оперон номер 590813, в состав которого входит исследуемый ген и 3 других гена. Изображение получено с помощью DOOR.

Анализ функционального сходства

На таблице 1 изображена краткая информация о функциях данных белков, взятая из базы KEGG и DOOR. Во-первых, наш искомый ген дает 'Uncharacterized protein', рядом с в том же опероне находятся мембранные белки, и еще в этом оперон спермидин синтаза. Во-вторых, на втором опероне встречаются самые разнообразные ферменты. Исходя их этих данных получаем, что данные белки не входят в один белковый комплекс, также она не являются белками, катализирующему последовательные реакции в организме. Стоит заметить, что гены на втором опероне встречаются у большего числа таксонов. Така как наш неизвестные белок окружают мембранные белки.

***