GO - String - Human Protein Atlas

Задание 1. GO Enrichment Analysis

1. list21.txt , 15 ID

2. В анализе обогащения участвовало 15 ID из 15

3. В выдаче оказалось 95 GO terms. Мы видим только находки с FDR P < 0.05.

4. Самые значимые GO terms (с самым низким значением p-value) такие: GO:0042761, GO:0030497, GO:0000038, GO:0006633, GO:0035338, GO:0035336, GO:0072330, GO:0046949, GO:0035337 и GO:0035384

5. Я взяла 5 самых значимых GO terms для построения графа, показывающего связи между биологическими процессами. Граф представлен на Рисунке 1

граф
Рисунок 1. Граф, содержащий 5 исследуемых GO terms

6. Граф оказался очень громоздким. Схема слишком объемная из-за GO:0035338 - этот процесс менее похож на 4 других, которые образуют группу. Узлы соединены между собой только соотношениями 'Is a...', то есть двигаемся от частного к общему.

7. Все исследуемые ID участвуют в клеточном метаболизме. Судя по GO terms очень вероятно, что ID осуществляют метаболизм липидов, а именно жирных кислот.

Задание 2. String

1. С помощью сервиса String я построила граф, в узлах которого располагаются белки (в данной задаче будем считать их белками) из файла. Его можно увидеть на Рисунке 2.

граф
Рисунок 2. Граф, построенный с помощью сервиса String

2. 3D структуры известны или предсказаны для 6 узлов из 15

3. По цветам рёбер полученного графа можно судить о типе взаимодействий между узлами. Каждое ребро служит неким доказательством наличия взаимодействия между узлами. Подавляющее число взаимодействий определены экспериментально (розовый цвет ребра) и/или взяты из курируемых баз данных (голубой). Многие ID коэкспрессируются (черный) и/или гомологичны (светло-голубой). Также для многих ID есть доказательства, полученные анализом текстовой информации - textmining (салатовый).

В полученном графе были представлены не все типы взаимодействий. Тогда я нажимала More и в графе появлялись новые связи и взаимодействия. После пары нажатий появились взаимодействия на основе совместной встречаемости генов (синий) и 'соседства' генов (зелёный).

4. В String можно посмотреть на представленность изучаемого набора белков в различных организмах. Для белков из моего списка вывод представлен на Рисунке 3.

Цвет квадратика говорит о Score выравнивания - чем темнее, тем более достоверная находка. Интересно, что один из исследуемых белков неплохо выравнивается с белками бактерий и архей разных таксонов. Также я посмотрела на выравнивания внутри эукариот, и белки мне не показались очень консервативными.

граф
Рисунок 3. Gene coocurrence

5. В String  была получена информация о коэксперссии изучаемых белков (Рисунок 4).

У человека только 2 пары белков из списка предположительно коэкспрессируются. Если рассмотреть и другие организмы, то для большей части изучаемых белков есть данные о коэкспрессии. Более тёмный цвет квадратика свидетельствует о том, что выше coexpression score.

граф
Рисунок 4. Gene coexpression

Вернуться на главную