GO - String - Human Protein Atlas

Часть 1.GO Enrichment Analysis

Файл с ID list41.txt, в списке 14 ID, в анализе обогащения участвовали все 13. В выдаче оказалось 14 GO terms с поправленным p-value(FDR)<0.05. 10 самых значимых результатов представлены на рисунке ниже.

10 самых значимых GO terms в выдаче
Граф с 5 самыми значимыми GO terms(отмечены цветом)
Между узлами графа существуют только отношения is a. 5 GO terms являются метаболическими процессами клетки. Эти три узла относятся к метаболизм фосфора, оставшиеся два - к метаболизму флавинсодержащих веществ, который, в свою очередь, входит в процессы метаболизма гетероциклов, клеточных азотсодержащих веществ, азоторганических соединений и циклических органических соединений. Азот и фосфор - самые часто встречающиеся в органических веществах элементы после углерода, водорода и кислорода (самые распространенные гетероатомы), а эти ID описывают процессы их метаболизма.

Часть 2. String

Изображение полученного графа
Трехмерная структура известна или предсказана для всех 13 узлов графа. Четыре белка (ACPP, PXYLP1,LENEP, ACP1) никак не связаны с другими, из оставшихся все, кроме BLVRB связаны друг с другом совместным упоминанием в статьях (textmining), BLVRB, RFK, FLAD1, ACP5,ENPP1, ENPP3 взаимодействуют между собой по информации из курируемых баз данных. ACP5 коэскспрессируется с PAPL, BLVRB, RFK, FLAD1, ENPP3, ENPP1. ENPP1 и ENPP3, FLAD1 и RFK коэкспрессируются попарно. Ген ACP5 расположен по соседству с генами RFK, FLAD1, ENPP3, ENPP1. Так же рядом расположены гены RFK с ENPP3 ENPP1. Взаимодействие между FLAD1 и RFK доказано экспериментально, белки ENPP3 и ENPP1 гомологичны, они же часто встречаются в геноме вместе. Взаимодействие gene fusions не появилось на графе после нескольких попыток More, поэтому я решила, что оно просто неприменимо к этим генам и родственным к ним.
Консервативность белков (co-occurence)
Все белки высококорсервативны у Opistokhonta, Viridiplantae и Stramenopiles, а также Proteobacteria. Белки RFK, FLAD1, ACP1 консервативны почти у всех организмов.
Коэкспрессия генов белков у человека и других видов. Коэкспрессия генов почти не наблюдается, значения для всех генов низкие, хоть как-то связана экспрессия тех генов, которые связаны друг с другом отношениями коэкспрессии на графе выше.

Задание 3. Поиск гомологов белков в неаннотированном геноме.