GO Enrichment Analysis
- list13.txt; 20IDs
- В анализе обогащения участвовало 20ID из 20
- В выдаче оказалось 39 GO terms, так как именно столько не превысило порог P-value меньше 0.05
- 10 наиболее значимых GO terms:
- Граф с 5 наиболее значимыми GO Terms:
- Узлы графа связаны отношением "is a.." то есть просто соотношением вложенности множеств. Взятые белки, вероятно, участвуют в процессах метаболизма органических кислот.
- Для ответа на этот вопрос я построил граф с большим числом (20) GO термов. По всей видмости, все белки из списка играют роль в метаболизме жирных кислот.
String
- Для всех 20 белков указано наличие 3D структур
- Цвета ребер графа определяют тип взаимодействия между узлами. По центру есть кластер из 4 белков, связанных многими типами взаимодействий - они коэкспрессируются, консервативны, часть из них гомологична. По видимому этот кластер белков хорошо изучен - они определены эксперементально, о них есть данные в кукируемх базах данных. Вне этого кластера, большинство белков коэкспрессируется с ним, о многих есть доказательства, полученные анализом текстовой информации (textmining)
- Консервативность
На рисунке более темными квадратиками обозначены более достоверные находки. Для моего набора белков все выглядит очень закономерно: довольно низкая консервативность для архей и бактерий (хотя не 0, около 30%), для нехордовых эукариот она выше (около 50%), для тетрапод она становится очень высокой 80-90%. Внутри приматов консервативность близка к 100%.
- Коэкспрессия
. У человека 4-5 пар генов насколько-то значительно коэкспрессируются (на 20-50%), многие другие пары связаны более слабыми коэкспрессиями. Если посмотреть на другие организмы, то можно увидеть, что для большинства пар белков есть данные о коэкспрессии. Примечательно, что пары с наиболее ярко выраженной коэкспрессией для человека и других организмов сильно отличаются.