Практикум 7

Автор старался, но не может гарантировать отсутствие биологических ошибок.

Для анализа белков были выбраны базы данные/сервисы Human Protein Atlas, GO, STRING. Мой список ID.

Human Protein Atlas

В первую очередь с помощью базы данных Human Protein Atlas познакомились с данными генами получше - таблица 1. Программа описывает белки, встречающиеся у человека в тканях, органах, используя результаты полученные различными методами.

Таблица 1. Данные о выданных генах согласно базе данных Human Protein Atlas.
ID Белок Молекулярная функция белка Биологическая функция белка Общий профиль экспрессии белка
GOT1L1 Glutamic-oxaloacetic transaminase 1 like 1 Aminotransferase, Transferase - -
AOC2 Amine oxidase copper containing 2 Oxidoreductase Catecholamine metabolism -
AOC3 Amine oxidase copper containing 3 Oxidoreductase Cell adhesion Избирательная экспрессия в цитоплазме клеток гладких мышц, адипоцитов, надпочечников, альвеол
DDC Dopa decarboxylase Decarboxylase, Lyase Catecholamine biosynthesis Экспрессия в цитоплазме разных тканей, особенно в почечных канальцах
GOT2 Glutamic-oxaloacetic transaminase 2 Aminotransferase, Transferase Lipid transport, Transport Общая цитоплазматическая экспессия с зернистым рисунком
GOT1 Glutamic-oxaloacetic transaminase 1 Aminotransferase, Transferase Amino-acid biosynthesis Общая цитоплазматическая экспрессия, особенно в ЦНС, сердечной мышце и печени
MAOB Monoamine oxidase B Oxidoreductase - Повсеместная гранулярная цитоплазматическая экспрессия с переменной интенсивностью
MAOA Monoamine oxidase A Oxidoreductase Catecholamine metabolism, Neurotransmitter degradation Экспрессия в цитоплазме с зернистым рисунком во всех тканях
TAT Tyrosine aminotransferase Aminotransferase, Transferase Phenylalanine catabolism, Tyrosine catabolism -
MIF Macrophage migration inhibitory factor Cytokine, Isomerase Immunity, Inflammatory response, Innate immunity В основном цитоплазматическая эксперссия во многих тканях, в том числе иммунных клетках
GLYAT Glycine-N-acyltransferase Acyltransferase, Transferase Detoxification Избирательная цитоплазматическая экспрессия в почечных канальцах, гепатоцитах и придатке яичка
IL4I1 Interleukin 4 induced 1 Oxidoreductase Adaptive immunity, Immunity Высокая экспрессия в восплительных клетках, в основном лимфатических узлов, селезенки и миндалин
ALDH3A1 Aldehyde dehydrogenase 3 family member A1 Oxidoreductase Lipid metabolism В основном цитоплазматическая экспрессия, в разных тканях, особенно в плоском эпиталии и желудке
ALDH3B2 Aldehyde dehydrogenase 3 family member B2 Oxidoreductase Lipid metabolism Цитоплазматическая экспрессия в нескольких тканях, например, молочной железе
ALDH3B1 Aldehyde dehydrogenase 3 family member B1 Oxidoreductase Lipid metabolism Экспрессия в нескольких тканях, включая реснитчатые клетки дыхательного эпителия и фаллопиевых труб.
PAH Phenylalanine hydroxylase Allosteric enzyme, Monooxygenase, Oxidoreductase Phenylalanine catabolism Избирательная цитоплазматическая экспрессия в гепатоцитах, проксимальных канальцах почек и железистых клетках желчного пузыря
HPD 4-hydroxyphenylpyruvate dioxygenase Dioxygenase, Oxidoreductase Phenylalanine catabolism, Tyrosine catabolism Избирательная цитоплазматическая экспрессия в печени и почках

Получилось, что среди моих белков преобладают оксидоредуктазы и трансферазы, присутствуют единичные лиазы и изомеразы. Среди биологических функций выделяется метаболизм катехоламинов и катаболизм фенилаланина, экспрессируются белки в разных тканях человека.

Gene Ontology (GO)

Далее было решено исследовать базу данных Gene Ontology (GO). Она представляет собой граф биологических терминов, соединенных различными отношениями. Проведем анализ обогащения терминами GO, это позволит сравнить частоты терминов GO с частотами по всем генам. ID генов были вставлены в специальное поле, оставили по умолчанию, что гены из Homo sapiens, раздел терминов, по которым велся анализ менялся, остальные параметры оставлены по умолчанию. Далее представлены результаты для каждой группы терминов.

Аспект молекулярных функций

GO molecular function enrichment analysis
Рисунок 1. Результаты анализа обогащения терминами GO по аспекту молекулярных функций.

Файл с результатами. Убеждаемся, что часто встречается оксидоредуктазная активность, особенно окисления первичных аминов, а также трансферазная активность. Из интересного, в моем списке присутствуют белки, связанные с процессом связывания витамина B6 и пиридоксаля 5'-фосфата.

Аспект биологических процессов

Рисунок 2. Результаты анализа обогащения терминами GO по аспекту биологических процессов.

Файл с результатами. Среди биологических процессов, для моих белков особо характерно участие в метаболизме органических кислот, и в целом в процессах метаболизма (отдельно выделяется катаболизм).

Аспект клеточных компонентов

Нет значимых находок. Не выявлено специфических терминов клеточных компонентов, с которыми связаны наши белки.

STRING

STRING protein-protein interactions
Рисунок 3. Общая схема всех белок-белковых взаимодействий, выданная STRING.

Далее захотелось посмотреть на белок-белковые взаимодействия. Программе STRING на вход был подан список моих белков и указано, что они из Homo sapiens. Результаты представлены на риуснках 3-5.
Получилось, что взаимодействий GLYAT с другими белками не обнаружено. Выявлено лишь небольшое сходство с некоторым предсказанным белком Caldisalinibacter kiritimatiensis из группы террабактерий (рисунок 4).
Белки со схожими функциями (соответственно и названы они были похоже) демонстрируют высокую вероятность совместной экспрессии (рисунок 5). Также в общем графе взаимодействий можно заметить, что объекты "выделились" в две группы, вероятно и в живом организме их взаимовлияние наиболее высоко.

STRING cooccurrence
Рисунок 4. Совместное появление схожих генов белков в разных организмах, чем темнее оттенок, тем большее сходство демонстрируется.
STRING coexpression scores
Рисунок 5. Показатели одновременной экспрессии белков, основаннные на паттернах экспрессии РНК и на совместной регуляции белков, обеспечиваемой ProteomeHD.

Вывод

Использование разных программ позволило получить более широкую картину о моих белках. Безусловно, при этом прослеживается сходство в выдачах разных программ, ведь исследуемые белки не изменяются.