1. list21.txt , 15 ID
2. В анализе обогащения участвовало 15 ID из 15
3. В выдаче оказалось 95 GO terms. Мы видим только находки с FDR P < 0.05.
4. Самые значимые GO terms (с самым низким значением p-value) такие: GO:0042761, GO:0030497, GO:0000038, GO:0006633, GO:0035338, GO:0035336, GO:0072330, GO:0046949, GO:0035337 и GO:0035384
5. Я взяла 5 самых значимых GO terms для построения графа, показывающего связи между биологическими процессами. Граф представлен на Рисунке 1
6. Граф оказался очень громоздким. Схема слишком объемная из-за GO:0035338 - этот процесс менее похож на 4 других, которые образуют группу. Узлы соединены между собой только соотношениями 'Is a...', то есть двигаемся от частного к общему.
7. Все исследуемые ID участвуют в клеточном метаболизме. Судя по GO terms очень вероятно, что ID осуществляют метаболизм липидов, а именно жирных кислот.
1. С помощью сервиса String я построила граф, в узлах которого располагаются белки (в данной задаче будем считать их белками) из файла. Его можно увидеть на Рисунке 2.
2. 3D структуры известны или предсказаны для 6 узлов из 15
3. По цветам рёбер полученного графа можно судить о типе взаимодействий между узлами. Каждое ребро служит неким доказательством наличия взаимодействия между узлами. Подавляющее число взаимодействий определены экспериментально (розовый цвет ребра) и/или взяты из курируемых баз данных (голубой). Многие ID коэкспрессируются (черный) и/или гомологичны (светло-голубой). Также для многих ID есть доказательства, полученные анализом текстовой информации - textmining (салатовый).
В полученном графе были представлены не все типы взаимодействий. Тогда я нажимала More и в графе появлялись новые связи и взаимодействия. После пары нажатий появились взаимодействия на основе совместной встречаемости генов (синий) и 'соседства' генов (зелёный).
4. В String можно посмотреть на представленность изучаемого набора белков в различных организмах. Для белков из моего списка вывод представлен на Рисунке 3.
Цвет квадратика говорит о Score выравнивания - чем темнее, тем более достоверная находка. Интересно, что один из исследуемых белков неплохо выравнивается с белками бактерий и архей разных таксонов. Также я посмотрела на выравнивания внутри эукариот, и белки мне не показались очень консервативными.
5. В String была получена информация о коэксперссии изучаемых белков (Рисунок 4).
У человека только 2 пары белков из списка предположительно коэкспрессируются. Если рассмотреть и другие организмы, то для большей части изучаемых белков есть данные о коэкспрессии. Более тёмный цвет квадратика свидетельствует о том, что выше coexpression score.