База данных String.

В виду того, что сейчас конец лета, а у меня горят пересдачи и курсовая, я объективно понимаю, что мне поможет либо Бог, либо удача, поэтому для выбора базы данных для исследования я выбрал самый эффективный метод, с которым можно познакомиться по ссылке.

Для выполнения данного практикума мне был выдан список из генов. Для того чтобы определить взаимосвязи между данными генами, мне выпал я решил воспользоваться веб-сервисом STRING, который предоставляет информацию о наличии белок-белковых взаимодействиях. Во вкладке Multiple proteins я ввел список генов, в качестве организма указал Homo sapiens. Программа выдала граф отражающий взаимосвязи между генами (рис.1). Ребра данного графа соединяют белки генов, которые могут взаимодействовать с друг другом. Цвет ребра указывает на тип доказательства взаимодействия данных белков. Так, например, самое распрастраненное доказательство в случае моих генов связано с тем, что почти все белки упоминались друг с другом в научных статьях, а также гомологи ELOVL(1-5) упоминались вместе в других организмах (рис.2). Также присутсвие во всех узлах графа картинки с белком, указывает на то что для всех белков генов известны 3d структуры. Остальные типы доказательств представлены на рисунках 3-5.

Кекс
Рис.1 Сеть взаимосвязанных генов из списка.
Кекс
Рис.3 Совместные упоминания в научных статьях.
Кекс
Рис.2 Взаимодействия белков показанные эксперементально.
Кекс
Рис.4 Ассоциации в курируемых базах данных.

Для того чтобы увидеть более подробную информацию о доказательствах нужно нажать на ребро, откроется окно в котором будет показан interaction score, которая оценивает достоверность доказательства, также будет показана общая информация о белках. Так, например, из описания ELOVL5 и HSD17B12 мы можем узнать, что их белки участвуют в цикле элонгации длинноцепочечных жирных кислот (ELOVL5 - 1-я реакция, HSD17B12 - 2-я реакция). Также данные гены упоминаются в абстрактах из Pubmed, как и гомологи белков данных генов в других организмах. Также взаимодействие белков данных генов показано эксперементально, но score данного доказательства довольно низок, если пройти по ссылке Experimental/Biochemical Data то можно узнать каким методом было показано взаимодействие данных белков, в данном случае это pull-down assay.

Кекс
Рис.5 Подробное описание белков ELOVL5, HSD17B12 и из взаимосвязи.
Кекс
Рис.6 Анализ обогащения по функциональной принадлежности.

Было интересно посмотреть в каких процессах участвуют мои белки и где они находятся, для этого я зашел во вкладку analysis. Анализ обогащения по функциональной принадлежности показал следующие результаты (рис.6):

  • Биологические процессы:
    1. Биосинтез очень длинных жирных кислот (стоит отметить что в данном процессе участвует всего 13 белков, 13 из которых мои)
    2. Элонгации жирных кислот
    3. Метоболизме сфинголипидов
    4. Биосинтез азоторганических соединений (как раз метоболизм сфинголипидов)
    5. Элонгация насыщенных и мононенасыщенных жирных кислот
    6. Метаболизм линолевой кислоты
  • Местоположение в клетке:
    1. Мембрана эндоплазматического ретикулума
    2. Являются интегральными белками мембраны эндоплазматического ретикулума
  • Молеклярные функции:
    1. Дегидратация 3-гидрокисацил-СоА
    2. И еще куча дегидратации (что то там)-3-гидрокисацил-СоА :D

Далее я увидел, что String предоставляет информацию о совместном присутствие генов в различных организмах (рис.7). При общем взгяде на картинку можно понять, что у археев присутствует только ген HSD17B12, у бактерий только 4 гена HSD17B12, TECRL, HACD3 и TECR, у эукариот присутсвует весь набор. Далее я решил пойти по древу пока не эволюционирую дойду до человека. Из интересного на моем пути могу отметить:

  1. Среди всех эукариот только у альвеолят, амёбозой, трипаносоматид, метамонад и еще трех видов простейших полностью отсутствует ген HIGD2A.
  2. У грибов имеется полный набор данных генов (я не знаю почему мне это показалось интересным, просто особенное отношение к грибам видно)
  3. Отсуствие гена HIGD2A в некоторых таксонах и у отдельных представителей Opisthokonta
  4. Высокая представленность каждого гена у человека
  5. Также я решил раскрыть полностью ветку ведущую к представителям приматов, оказалось, что именно у Gorilla gorilla резко падает представленность генов HACD1 и TECR.

Кекс
Рис.7 Cовместное присутствие генов в различных организмах.