Практикум 11

GO Enrichment Analysis

  1. list13.txt; 20IDs
  2. В анализе обогащения участвовало 20ID из 20
  3. В выдаче оказалось 39 GO terms, так как именно столько не превысило порог P-value меньше 0.05
  4. 10 наиболее значимых GO terms:
  5. Граф с 5 наиболее значимыми GO Terms:
  6. Узлы графа связаны отношением "is a.." то есть просто соотношением вложенности множеств. Взятые белки, вероятно, участвуют в процессах метаболизма органических кислот.
  7. Для ответа на этот вопрос я построил граф с большим числом (20) GO термов. По всей видмости, все белки из списка играют роль в метаболизме жирных кислот.

String

  1. Для всех 20 белков указано наличие 3D структур
  2. Цвета ребер графа определяют тип взаимодействия между узлами. По центру есть кластер из 4 белков, связанных многими типами взаимодействий - они коэкспрессируются, консервативны, часть из них гомологична. По видимому этот кластер белков хорошо изучен - они определены эксперементально, о них есть данные в кукируемх базах данных. Вне этого кластера, большинство белков коэкспрессируется с ним, о многих есть доказательства, полученные анализом текстовой информации (textmining)
  3. Консервативность На рисунке более темными квадратиками обозначены более достоверные находки. Для моего набора белков все выглядит очень закономерно: довольно низкая консервативность для архей и бактерий (хотя не 0, около 30%), для нехордовых эукариот она выше (около 50%), для тетрапод она становится очень высокой 80-90%. Внутри приматов консервативность близка к 100%.
  4. Коэкспрессия . У человека 4-5 пар генов насколько-то значительно коэкспрессируются (на 20-50%), многие другие пары связаны более слабыми коэкспрессиями. Если посмотреть на другие организмы, то можно увидеть, что для большинства пар белков есть данные о коэкспрессии. Примечательно, что пары с наиболее ярко выраженной коэкспрессией для человека и других организмов сильно отличаются.