Практикум 11

Как в любой задаче, для начала обозначим, что дано:

  1. Список ID: ADH5,ANPEP,ESD,GCLC,GCLM,GGACT,GGCT,GGT1,GGT2,GGT5,GGT6, GGT7,GGTLC1,GGTLC2,GGTLC3,GPX2,GPX3,GPX4,GPX5,GPX6,GPX7,GPX8,GSR, GSS,LAP3,NPEPPS,OPLAH,PRDX1,PRDX2,PRDX3,PRDX5,PRDX6
  2. Список баз данных: GO, STRING, Human Protein Atlas, KEGG, Reactome, GeneCards, Panther

Reactome

Так как я не знала, что это вообще за ID, но хотелось узнать, что это за гены и к каким процессам имеют отношение, то надо было выбрать базу данных. Прочитав презентацию и впечатлившись картинками, я решила, что мне поможет в этом база данных Reactome.

Запустив поиск, сначала я испугала выдаче(рис.1), но потом взяла себя в руки и начала смотреть. Примечательно, что GGTLC2, GGTLC1, GGACT,GGTLC3 никуда не были картированы.

Рис1. Выдача Reactome
Рис2. Чуть более приятная выдача Reactome

Из результатов с самым низким E-value и тыкания на коричневые участки карты(рис.2), делаем вывод об участии генов в основном в следующем:

  • Клеточные ответы на стимулы -> клеточные ответы на стресс -> клеточные ответы на химический стресс -> детоксикация активных форм кислорода -> KEAP1-NFE2L2 путь -> ядерные процессы, опосредуемые NFE2L2 -> NFE2L2-регуляция антиоксидантных/детоксикационных ферментов (NFE2L2 regulating anti-oxidant/detoxification enzymes), вот тут я не поняла, что это за NFE2L2 и пошла искать в GeneCards, об этом ниже
  • Метаболизм -> афлатоксин активация и детоксификация -> ... -> Синтез и переработка глутатиона
  • И разные варианты, связанные с болезнями, но у них p-value хуже

GeneCards

Помните, выше появилась проблема с тем, что значит то, что часть наших генов вовлечены в какие-то связи с NFE2L2, регулирующим антиоксидантные/детоксикационные ферменты. Поиск по GeneCards пролил свет на ситуацию: тут сказано о том, что это ген, кодирующий фактор транскрипции, который регулирует гены, содержащие элементы антиоксидантного ответа в своих промоторах; многие из этих генов кодируют белки, вовлеченные в воспалительный ответ.

String

Так как я боюсь выдач без картинок, а мы уже поняли, что все завязано за борьбе с окислительным стрессом, то пойдем в String, чтобы посмотреть на связи между белками. Плюс можно будет увидеть, у кого есть предсказанная структура (в кружочках есть мини картинка).

Рис3. Выдача String. Network

Коротко о выдаче: Oxxxymiron - Все переплетено

Долго о выдаче: много связей экспериментально определены (фиолетовые линии), половина белков соседствуют (с зелеными линиями) и достаточно много коэскпрессируется (черные линии). Желтые линии для нагруженности картинки, видимо, потому что они показывают то, что эти гены просто встречются вместе в текстах, это ни о чем не говорит.

Рис4. Выдача String. Коэкспрессия

А тут мы видим, что на самом деле нас обманули и никакиой кучи коэкспрессий нет. Только у человека GGT1(профермент глутатион гидролазы 1) и GGTLC1 (гамма-глутамилтрансферазы) имеют какой-то знакочимый результат, что достаточно логично.

Мой attitude

Reactome хорош, потому что наглядный, с понятными результатами без супер страшных таблиц, буду рекомендовать знакомым)))

String возможно удобен для меньшего количества генов, потому что иначе все превращается в клубок, в котором сложно что-то оценить глазками, но зато можно быстро узнать, у кого есть структура, и как-то оценить взаимоотношения, это удобно.

GeneCards базовая база данных для поиска информационной справки по конкретному гену.

Отзывы все позитивные, так как те базы данных, которые выдают неюзерфрендли результаты я и не брала, потому что в GO, например, для меня с нуля было сложно разобраться, а эти наглядные и понятные