Для работы мне был предложен следующий список генов: A4GALT, B3GALNT1, B3GALT5, FUT1, FUT2, GBGT1, GLA, HEXA, HEXB, HEXDC, NAGA, ST3GAL1, ST3GAL2, ST3GAL4, ST8SIA1. Для начала хорошо бы узнать, с чем мы будем работать. Для этого был использован поиск по базе данных GO со стандартными параметрами (геном человека, группировать по биологическим процессам, подсчет p-value с помощью точного теста Фишера, подсчет вероятности ложноположительного результата). С его помощью я получила общее представление о белках: они вовлечены в метаболизм липидов (для GO-term "lipid metabolic process" p-value = 1.09e-16, false discovery rate = 1.55e-13, количество находок -- 14 из 15 белков). Стоит учесть, что белков, для которых что-то найдено, 14 из 15 (все, кроме HEXDC -- он, по всей видимости, отсутствует в базе данных GO).
Можно выбрать другие источники данные из аннотаций (стандартный, использованный выше -- биологические процессы), например, функция. В данном случае все белки являются ферментами (p-value=3.96e-9, FDR=3.34e-6), большинство из них -- гликозилтрансферазы (12 белков, p-value = 1.63e-20, FDR = 8.27e-17).
Итак, все найденные в базе GO гены кодируют ферменты. В таком случае нам интересно, к какому конкретно метаболическому пути (или путям) они принадлежат. Для этого с помощью сервиса Reactome (раздел Analysis) построили карту процессов, в которые могут быть вовлечены белки, кодируемые указанными генами.
В данной схеме нас интересуют только поля, отмеченные различными оттенками желтого -- эти находки имеют p-value меньше 0.05. Рассмотрим самое интересное:
В чем же заключается роль этих белков в развитии вирусной инфекции? Для начала отмечу, что мы имеем дело с 3 белками: ST3GAL1, ST3GAL2, ST3GAL4. Далее возникает неточность: в диаграмме отмечена связь этих белков с созреванием некоторых белков вируса, однако я не нашла статей об этом :( Стоит заметить, что все три белка (для рассмотрения возьмем ST3GAL4) -- различные сиалотрансферазы, а сиаловая кислота, согласно литературным данным, узнается вирусами гриппа [2] и самого коронавируса [1], однако экспрессия ST3GAL не сильно кореллирует с экспрессией белка ACE2 (с которым связывается вирус для проникновения в клетку) [2]. Все это интересно, но не очень ясно, какова роль этих белков в развитии коронавирусной инфекции...
С помощью сервиса Human protein atlas я посмотрела, в каких тканях человека экспрессируются интересующий белок, а именно ST3GAL4. Оказалось, что он обнаруживается во многих органах, в том числе в респираторной системе (см. связь с SARS-CoV-2).
I don't know how to make footer properly. You may as well pretend you haven't seen this phrase!