Практикум 7. Базы данных KEGG, GO ...

Входные данные

Для анализа мне был предложен набор из 10 генов: (TST, SQOR, ETHE1, MPST, BPNT2, BPNT1, PAPSS1, SUOX, PAPSS2, SELENBP1) Предварительно посмотрев, какие белки кодируют гены у человека, мне показалось, что они связаны с какими-то функциями в митохондриях, так, например, среди них есть митохондриальная персульфиддиоксигеназа ETHE1, которая может перемещаться между ядром и цитоплазмой и подавлять апоптоз или сульфитоксидаза (тоже мт), которая катализирует окисление сульфита в сульфат, конечную реакцию окислительной деградации серосодержащих аминокислот.

Кроме того, что вероятно эти гены связаны с чем-то митохондриальным, также они все катализируют/связаны с какими-то реакциями, в которых участвуют серосодержащие вещества.

GO enrichment

Для начала хочется посмотреть в каких биологических процессах участвуют белки. Для того, чтобы предположить что-то более конкретное посмотрим на обогащение по биологической функции моего набора генов в базе данных GO (буду сравнивать частоты терминов с человеком и далее тоже).Параметры запроса включали использование точного теста Фишера для подсчёта P-value и поправки Бонферрони на множественное тестирование.

Рис.1. Функции набора белков

Исходя из увиденного, можно сказать, что белки участвуют в следующих процессах:

1)Катаболический процесс цианата (хм, ну ладно)

2)Процесс биосинтеза 3'-фосфоаденозин-5'-фосфосульфата

3)Метаболизм серосодержащих (отнесу сюда сульфатную ассимиляцию, процесс обмена сероводорода и серосодержащих аминокислот)

STRING

Теперь посмотрим на граф взаимодействий между белками моего набора генов:

Рис.2. Граф, полученный с помощью веб-сервиса STRING

Действительно, они все тесно связаны, причем почти все нескольким образом. Все связаны как минимум упоминанием в текстах вместе и "соседством", некоторых объединяет коэкспрессия, есть 3 пары гомологичных белка, а также есть пара PAPSS1 и PAPSS2, чье взаимодействие подтверждено экспериментально.

Из интересного, в разделе анализа я обнаружила, что мутации в 4 генах вызывает заболевание Этилмалоновую энцефалопатию и как выяснилось, это митохондриальное заболевание. Так что в общем, несмотря на то, что пока что каких-то конркетных связей с митохондриями найти не удалось (кроме того, что некоторые гены кодируются мтДНК), все же зацепка есть, так что ищем дальше.

Reactome, human atlas

На белковые функции и красивые соты решила посмотреть по-приколу:

Для моего набора белков можно выделить совместное участие в процессах окисления, метаболизме нуклеиновых кислот(в частности то, что обсуждалось про серусодержащие выше), углеводов(в частности, глюкозоаминогликана) и некое "Association of TriC/CCT with target proteins during biosynthesis", что как я поняла значит, что мой TST участвует в сязывание вот этого эукариотического шаперонина, который приводит к сворачиванию белков. (ну и ладно) Показалось странным, что тут отобразилось, что вот на эту митохондриальную энцефалопатию влияет только 1 белок, а в STRINGe было указано аж 4, решила посмотреть на этот 1 белок гена PAPSS2 в human atlas, а также белок PAPSS1, который в Reactome светится, как онкомаркер

Рис.6. Вообщем тут особо оказалось ничего интресного, не особо изучено участие этих генов в заболеваниях, про PAPSS2 и энцефалопатию ничего, что можно как-то интрпретировать в этом контексте, просто известно, что участвуют. Но зато красивая картинка экспресии PAPSS1 при раках разного.

Итог

Набор данных мне генов кодирует белки, которые участвуют в катаболитическом процессе цианата, всяких окислительных процессах и метаболизме серосодержащих. Также явной нитью прослеживается что-то митохондриальное, но по мимо того, что некоторые гены локализуются в мтДНК и, что в целом процессы окисления часто связаны именно с дыхательной цепью в матриксе мт и происходят в ней особо ничего конркетного сказать, наверное, нельзя. Мне понравился string, там в целом можно было сразу найти все, что нужно, да еще и с разными картинками.