Идея

После поверхностного изучения выдачи разных баз данных для данного списка последовательностей было решено остановится на базе Panther и в качестве отчета составить граф связей между различными элементами базы, причастными к исходному списку белков.

Для этого были выбраны 5 записей из базы Biological Processes с наименьшим E-value и сведены в один граф:

Результат был признан недостаточно интересным и непрезентабельным, так как все записе в графе связанны простыми перемычками типа is a и такая схема является крайне малоинформативной и, при детальном рассмотрении всего лишь объясняет значения выбранных терминов.

Развитие идеи

Тогда для усложнения графа было решено взять одну из последовательностей из базы Biological Processes с хорошим весом (в нашем случае это Сanonical glycolysis) и при помощи вкладки Child Terms найти по цепочке связанные записи из баз Cellular Component и Molecular Function. Далее найденые записи были сведены в граф:

Вот теперь он цветной. Ясно видно, что при увеличении количества связанных по цепочке записей, подающихся на вход, граф растет эскпоненциально, и, аналогично "правилу шести рукопожатий", скорее всего вместит в себя большую часть известных человеку метаболических путей уже при введении 8-9 связанных последовательностей.

Из наших же данных можем продположить, что исходный набор белков был связан преимущественно с примитивным метаболизмом сахаров.