После поверхностного изучения выдачи разных баз данных для данного списка последовательностей было решено остановится на базе Panther и в качестве отчета составить граф связей между различными элементами базы, причастными к исходному списку белков.
Для этого были выбраны 5 записей из базы Biological Processes с наименьшим E-value и сведены в один граф:
Результат был признан недостаточно интересным и непрезентабельным, так как все записе в графе связанны простыми перемычками типа is a и такая схема является крайне малоинформативной и, при детальном рассмотрении всего лишь объясняет значения выбранных терминов.
Тогда для усложнения графа было решено взять одну из последовательностей из базы Biological Processes с хорошим весом (в нашем случае это Сanonical glycolysis) и при помощи вкладки Child Terms найти по цепочке связанные записи из баз Cellular Component и Molecular Function. Далее найденые записи были сведены в граф:
Вот теперь он цветной. Ясно видно, что при увеличении количества связанных по цепочке записей, подающихся на вход, граф растет эскпоненциально, и, аналогично "правилу шести рукопожатий", скорее всего вместит в себя большую часть известных человеку метаболических путей уже при введении 8-9 связанных последовательностей.
Из наших же данных можем продположить, что исходный набор белков был связан преимущественно с примитивным метаболизмом сахаров.