Собственно, к нам в руки попал список генов. Так как среди них не было ни одного знакомого, было решено
тут же бежать в STRING с целью узнать, какие белки стоят за этими генами, в идеале найти какие-нибудь взаимосвязанные и проанализировать их
с помощью других баз данных.
Итак, STRING — база данных, покрывающая почти 68 млн белков и их взаимодействия из разных организмов. Ей был скормлен выданный
список генов. На выходе получился красивый граф, где в узлах соответствующие белки, а между отображены связи. Там же были представлены
и результаты GO-анализа:
Заметно, что многие гены из списка кодируют белки, участвующие в транспорте и метаболизме различных липидов и их производных.
Согласно выдаче, изначальный граф уже содержал значимо больше взаимодействий, чем случайный. Однако в нём очень много рёбер, обозначающий
текс-майнинг, что скучновато осложняет анализ. Поэтому эти рёбра были убраны, но добавлены ещё узлы (Рис.2). В итоге
обособилась группа из белков STS, SUMF1, SUMF2. Их взаимодействие экспериментально определено, SUMF1 и SUMF2 являются гомологами, ген STS соседствует с ними обоими, но SUMF1 и SUMF2 друг с другом нет. С ними мы пойдём в Human Protein Atlas.