Левин И., 4-й семестр, практикум 11

Браузеры последовательностей

Часть 1: Gene Ontology

Вопрос 1

Название моего файла с ID: list15.txt;

Количество ID в списке: 33;

Вопрос 2

Сколько ID участвовало в анализе обогащения: 33;

При этом почему-то выдало это:

nenorm_res.png

И лично я не могу понять, почему 33 из 34, если в общей сумме я забивал 33... Грешу на символ переноса строки только.

Вопрос 3

Количество GO terms в выдаче: 124 штуки. Они отфильтрованы по FDR P < 0.05 (поправленное P-value). Если фильтр снять, то GO terms может оказаться и больше.

Вопрос 4

Самые значимые GO terms (топ 10):

  1. sterol metabolic process (GO:0016125);
  2. cholesterol metabolic process (GO:0008203);
  3. secondary alcohol metabolic process (GO:1902652);
  4. steroid metabolic process (GO:0008202)
  5. cholesterol biosynthetic process (GO:0006695)
  6. secondary alcohol biosynthetic process (GO:1902653);
  7. sterol biosynthetic process (GO:0016126);
  8. steroid biosynthetic process (GO:0006694);
  9. organic hydroxy compound metabolic process (GO:1901615);
  10. alcohol metabolic process (GO:0006066).

Вопрос 5

Comparison_chart.png
Рис. 1. Граф GO с 5-ю самыми значимыми находками GO Enrichment Analysis моих ID

Вопрос 6

Анализ полученных результатов: как мы можем заметить, 5 самых значимх GO terms оказались у нас метаболическими процессами, причем все они связаны между собой связями "Is a", что говорит нам о том, что 5 наших значимых GO terms в контексте наших ID являются одним и тем же метаболическим процессом - биосинтезом холестерола. Довольно интересно получилось :)

Вопрос 7

Взаимосвязь последовательностей, закодированных под моими ID: насколько я понял, все они участвуют в биосинтезе какой-то органической молекулы (видимо, холестерола). Это, собственно, главное, что их объединяет. Но при этом много GO terms более обобщенных про биосинтез разных биомолекул и просто органических молекул, поэтому, скорее всего, холестерол является только одним из веществ, в синтезе которого мои "последовательности" могут участвовать. При этом нельзя исключать и каких-нибудь метаболических процессов, не направленных на синтез чего-либо, так как "метаболический процесс" - довольно обширное понятие.

Часть 2: STRING

Вопрос 1

STRING_graph.png
Рис. 2. STRING-граф взаимодействий моих ID

Вопрос 2

Для 30 узлов из 33 показано наличие 3D структур.

Вопрос 3

Узлы моего графа связаны следующими типами взаимодействий:

  1. from curated databases;
  2. experimentally determined;
  3. gene neighborhood;
  4. gene fusions;
  5. gene co-occurrence;
  6. textmining;
  7. co-expression;
  8. protein homology.

Вопрос 4

Консервативность ID моего списка:

В принципе, консервативность достаточно высокая, особенно для эукариот (отдельно можно выделить кладу Опистоконт с ОЧЕНЬ высоким уровнем консервативности); во всех остальных кладах представлены ортологи более-менее всех ID (стоит выделить вид Giardia intestinalis, где представлены ортологи меньшинства ID, при это с низкой консервативностью).

В кладах архей и бактерий общая консервативность заметно ниже, чем в эукариотах, а некоторые ID вообще не представлены (LCAT, PMVK, SOAT1, SOAT2, EBP и др.). Но и при этом есть хорошо представленные ID с высокой консервативностью: ACAT2, HMGCL, HMGCLL1, NSDHL и др.

string_gene_cooccurrence.png
Рис. 3. Карта gene co-occurrence моих ID

Вопрос 5

Совместная экспрессия ID моего списка: как можно в принципе заметить, коэкспрессия моих ID достаточно невелика у человека, но в это же время она очень высока у других организмов (обнаружена у 8 видов; напр. мышь). При этом всё-таки у человека есть несколько ID нашего списка, у которых заметный уровень коэкспрессии (HMGCS1 и [MSMO1, HMGCR, SQLE]; CYP51A1 и [IDI1, FDFT1]; а также менее заметная коэкспрессия у ряда других ID).

string_gene_coexpression.png
Рис. 4. Карта совместной экспрессии моих ID

Часть 3: Human Protein Atlas

Вопрос 1

Я выбрал MVD (Mevalonate diphosphate decarboxylase).

Вопрос 2

Описание ID: это у нас фермент, участвующий в биосинтезе холестерола на раннем этапе: он катализирует превращение мевалонат-пирофосфата в изопентил-пирофосфат, то есть декарбоксилирует и дегидратирует субстрат для биосинтеза холестерола (с гидролизом АТФ).

Вопрос 3

Специфика моего ID для мозга: как можно заметить по Brain Atlas (см. рис. 5), экспрессия мевалонатдифосфатдекарбоксилазы не специфична ни для одного участка мозга человека, свиньи и мыши.

HPA_Brain_Atlas.png
Рис. 5. HPA: Brain Atlas для MVD

Вопрос 4

Специфическая субклеточная локализация MVD: как нам говорит Human Protein Atlas, доказано, что в клетке MVD локализован преимущественно в цитозоле, а также дополнительно в белковых комплексах межклеточных контактов (Cell junctions).

HPA_Cell_Atlas.png
Рис. 6. HPA: Cell Atlas для MVD

Вопрос 5

Различие экспрессии РНК и белка MVD: как можно заметить, почти во всех органах экспрессия РНК и белка нашего ID примерно равна, но при этом в крови вообще нет белка, в глазу почти нет белка, для поджелудочной железы и проксимального пищеварительного тракта характерно наличие большего количества РНК, нежели ДНК, а для лёгких, почек, половой системы и мягких тканей - наоборот.

HPA_Tissue_Atlas.png
Рис. 7. HPA: Tissue Atlas для MVD

Вопрос 6

Экспрессия моего ID, как РНК: если рассматривать мой ID, как РНК, то больше всего он экспрессируется в двенадцатиперстной кишке, пищеводе, коре головного мозга и скелетной мускулатуре; меньше же всего он экспрессируется в гранулоцитах (белые клетки крови).

HPA_RNA_tissue_expression.png
Рис. 8. MVD RNA expression consensus histogram