Анализ списка ID производился в базе STRING.

При запросе был выбран поиск multiple proteins, а организмом стал человек. Для каждого белка известна (или предсказана) структура. Видно, что белки достаточно сильно "связаны" друг с другом. Однако UEVLD и LDHAL6B не имеют ни одной связи ни с одним из белков. Данная сеть имеет больше взаимодействий, нежели ожидалось (p-value < 1.0e-16). Это означает, что скорее всего белки действительно связаны между собой.

1

Для проверки наличия ассоциации между белками воспользуемся таблицей с аннотациями к белкам. По этим данным было построено облако слов.

2

Наиболее популярными словами являются CoA, дегидрогеназа, митохондриальный, Acyl CoA. Вероятно, полученный набор белков работает с карбоксильными группами, обладает окислительно-восстановительными свойствами, а также учавствует в метаболизме жирных кислот. Это подтверждается ссылкой STRING на базу GO. 3

Далее сеть была преобразована в таблицу и выгружена в питон. Важно отметить, что в таблице грани присутвуют парами: как от узала A к B, так и от B к A. Так что всего в сети присутствует 45 граней.

neighborhood_on_chromosome - соседство на хромосоме.
gene_fusion - слияние генов.
phylogenetic_cooccurrence - филогенетическое родство.
homology - гомология.
coexpression - совместная экспрессия.
experimentally_determined_interaction - экспериментальные доказательства взаимодействия.
database_annotated - ассоциации по базам данных.
automated_textmining - совместное появление белков абстрактах статей.
combined_score - общая оценка взаимодействия

Как внутри таблицы распределени те или иные оценки тех или иных взаимодействий? Для ответа на этот вопрос были построены гистограммы (хотел сделать интерактивную, но не получилось экспортировать в html :( ).

Большинство пар белков не являются соседними на хромосоме, негомологичны, далеко расположены на филогенетических деревьях, не коэкспрессируются, имеют мало ассоциаций в базах. Однако, среди этого набора, всё-таки, в каждой из названных категорий находятся пары белков, которые имеют устойчивое взаимодействие. Есть соседние, есть близкие родственники, есть соэкспрессирующиеся и тд.

Таким образом удалось выяснить, что данный набор белков расположен в митохондриальном матриксе, играет роль в окислительно-восстановительных процессах, процессах метаболизма жиров и ацетил-КоА. Между некоторыми белками наблюдаются устойчивые взаимодействия. Но не всеми. Кажется, что данный набор белков можно разбить на пару-тройку кластеров, внутри которых были бы достаточно взаимодействующие друг с другом белки.