Практикум 11. Белковые базы данны

Общая информация

Мне был дан следующий список белков:

ABHD12, ABHD6, BSCL2, CIDEA, FABP4, FITM1, FITM2, LPL, MGLL, PLIN1, PLIN2, PLIN3, PLIN4, PPP1CA, PPP1CB, PPP1CC, PRKACA, PRKACB, PRKACG

Ни одного знакомого белка, поэтому начнем смотреть все с начала.

String

Посмотрим, как белки связаны между собой. На вход программе подается список ID, по которым получается следующее изображение:

Рис. 1: Выдача String для данных белков

Из выдачи мы видим сразу несколько вещей:

1. Нет белков, которые ни с кем не связаны (как мы увидим дальше, функции у них очень разнообраные, так что этот факт довольно интересен)

2. Белок PLIN1 - местный супер босс, потому что связан почти со всеми остальными белками

3. Группа белков PPP1CC, PPP1CB, PPP1CA, PRKACB очень активно взаимодействует между собой

Разберем, что значат эти линии. Самые важные для нас цвета на схеме - бирюзовый (из курируемых баз данных) и фиолетовый (определенные экспериментально). Остальные обозначения:

Из этого мы можем сделать предположение, что PPP1CC, PPP1CB, PPP1CA - субъединицы одного белка, для которых наблюдается коэкспрессия и слияние генов.

Интересно, что значительная часть белков связана с различными глицеринами, а именно с регуляцией, как положительной, так и отрицательной. При этом два белка участвуют в разборке липидных капель, запомните их, мы их еще увидим.

Выше я написала про различные функции. Зачем я это сделала, если все так или иначе связаны с жирами? А потому что при всем этом функции у них действительно разные: от катабалического процесса моноацилглицерина и сборки липидных капель, до негативной регуляции сглаженного сигнального пути, участвующего в формировании паттерна дорсальной/вентральной нервной трубки, и реакции клетки на холод. Классно, здорово, белки очень интересные

Рассмотрим также таблицу, содержащую информацию о коэкспрессии генов:

Рис. 2: Выдача String, таблица коэкспрессии генов

Отлично, если мы посмотрим на нижнюю строчку с белком PPP1CA, мы увидим ту самую коэкспрессию, которую нашли по цветным полосочкам. Но что еще интереснее, это коэкспрессия нашего супер босса PLIN1. У человека он очень связан с белками FABP4, LPL, CIDEA, PLIN4, это самые заметные точки на графике. А вот коэкспрессия этих генов у других организмов значительно меньше. FABP4 вообще теряет всю свою коэкспрессию у отличных от Homo sapiens видов, как и гены MGLL и LPL.

Reactome

Выдача этой программы показывает "картирование" белков на функциональные группы. Выдача имеет два вида:

Рис. 3: Вид номер один
Рис. 4: Вид номер два

Честно говоря, выдача не особо проста для осознания, но по второй картинке мы можем определить, что значительная доля белков участвует в сигнальной системе, гемостазе, метаболизме, нервной системе и вуаля, вот они наши белки аутофагии, в том числе липофагии, пойманные нами ранее через String. В общем мы видим, что белки действительно очень разнообразны по функциям и системам.

Из интересного, можно увидеть, что есть белки транспорта небольших молекул, в том числе связанные с работой вазопрессина. Мы действительно можем найти различные сигнальные белки в разных местах: сигнальные молекулы на Rap1, онкомаркеры и т.д.

Также наши гены встречаются в группе связанных с различными болезнями, про онокомаркеры уже было сказано, но помимо этого их можно заметить в группе связанных с нарушениями развития (в том числе нервной системы) и группе связанных с инфекционными заболеваниями, а конкретно с Лейшманиозом.

Рис. 5: Участок карты Reactome с инфекционно связанными генами

The human protein atlas

В Reactome мы увидели белки, связанные с ЦНС, возьмем один из них - ABHD12. Для начала посмотрим на его внешний вид:

Рис. 6: Структура белка ABHD12, полученная из The Human Protein Atlas

Структура у него довольно интересная, она объясняется тем, что белок мембранный (белок внутренних мембран). Это субъединица гидролазы, которая участвует в расщеплении эндоканнабиноидного нейротрансмиттера 2-арахидонилглицерола в центральной нервной системе. Спасибо, википедия. А теперь что говорит сам атлас по поводу функций:

- Это ген белка, регулирующего липидный обмен

- "Способен гидролизовать окисленный фосфатидилсерин; окисленный фосфатидилсерин вырабатывается в ответ на тяжелый воспалительный стресс и представляет собой проапоптотический сигнал «съешь меня»"

- "Мутации в этом гене связаны с нейродегенеративным заболеванием PHARC (полиневропатия, потеря слуха, атаксия, пигментный ретинит и катаракта), возникающим в результате врожденной ошибки метаболизма эндоканнабиноидов"

Посмотрим на его локализацию в организме:

Рис. 7: Локализация экспрессии гена ABHD12 в организме человека

Можно заметить, что да, как было отмечено выше, он имеет большое значение в головном мозге, однако, встречается очень во многих системах. Но давайте подробнее рассмотрим локализацию в головном мозге:

Рис. 8: Локализация экспрессии гена ABHD12 в головном мозге человека

Вау, наш ген супер крут.

В мозге экспрессия локализована в олигодендроцитах и по-прежнему локализован во внутренних клеточных мембранах (было бы странно, если бы он переехал).

Закончим на радостной ноте - данный белок является потенциальной мишенью для лекарств,хотя антител на него пока нет. Будем ждать)

Заключение

Наиболее удобной и информативной мне показалась база The Human Protein Atlas, так как она содержит наибольшее количество информации, интуитивно понятна (ну, на самом деле не очень, но да ладно) и содержит много картинок.

String наиболее непонятная для меня база, потому что имеет довольно специфические задачи. Она супер гуд в плане использования, таблицы коэкспрессии понятные и классные. Но задача обнаружить, какие белки потенциально связаны между собой на теоритическом уровне, мне представляется очень узконапрвленной.

Reactome страшен на вид, но отлично визуализирует функции целой группы белков, а не одного, как это делает Atlas. Поэтому в зависимости от задач, разные базы хороши, но Atlas в сердечке