Отчёт по практикуму 11

Темы 11-го практикума — анализ GO-обогащения, БД String, The Human Protein Atlas. Для зачёта достаточно выполнить задания по хотя бы двум разделам, поэтому я выбрал String и The Human Protein Atlas. Кстати, мне был выдан список кодов белков под номером 29. Ответ изложен в соответствии с пунктами задания.

String

  1. Получившийся граф взаимодействий белков из списка представлен на рис. 1.
    string graph
    Рисунок 1. Граф взаимодействий по String
  2. 3D-структуры получены для всех 15 белков.
  3. Узлы связаны всеми видами взаимодействий, кроме Gene neighborhood (рёбра, соответствующие ему, должны иметь изумрудный цвет). Визуально самые частые связи — Textmining и From curated databases. Experimentally determined (пурпурного цвета) — только одно ребро, между HEXA и HEXB.
  4. Вкладка Cooccurrence позволяет судить о наличии гомологов наших белков в геномах представителей разных таксономических групп. Иллюстрация приведена на рис. 2.
    cooccurrence
    Рисунок 2. Скриншот диаграммы Cooccurrence
    Выделяются 4 наиболее консервативные колонки в диаграмме, соответствующие белкам GLA, HEXA, HEXB, NAGA. Интересно, что если углубляться в таксономию по направлению к человеку, то впервые все 15 позиций одновременно встретятся на классе Sarcopterygii (Лопастепёрые рыбы). Я не вполне понимаю причину наличия большого числа предположительных гомологов в геноме криптомонады Guillardia theta, впрочем, bit score этих находок не превышал 77 (кроме названных выше белков, у них — от 200), а String советует считать находки с весом около 60 и ниже скорее случайными. Так что можно списать почти заполненную строку на случайность при множественном тестировании.
  5. Совместную экспрессию ID нашего списка смотрим во вкладке Coexpression. То, что там содержалось, приведёно на рис. 3.
    coexpression
    Рисунок 3. Скриншот диаграммы Coexpression
    Картинка не впечатляет: самое большое значение у человека имеем для HEXA и HEXB, но и там coexpression score составляет 0,081. Для сравнения, GBGT1 и FUT2 у быка на правой половине страницы имеют значение 0,264. Большинство показателей совметной экспрессии из других видов найдены для коровы или свиньи.

The Human Protein Atlas

  1. Я выбрал ID ST3GAL2, поскольку для этого белка были пометки Approved во вкладках Tissue и Cell.
  2. Продукт этого гена относится к мембранным белкам типа II и катализирует перенос сиаловой кислоты из ЦМФ-сиаловой кислоты на галактозосодержащие субстраты. Как правило, белок находится в комплексе Гольджи, но путём протеолитического процессинга может быть переведён в растворимую форму. Он относится к гликозилтрансферазам семейства 29 и может использовать в качестве акцепторов те же субстраты, что и сиалилтрансфераза 4A.
  3. Выбранный белок не обладает доказанной специфичностью к какому-либо региону мозга человека, свиньи или мыши (см. рис. 4).
    brain regional specificity
    Рисунок 4. Плитка Brain Atlas из вкладки Summary
  4. В клетке белок локализован преимущественно в везикулах (см. рис. 5).
    cell compartment specificity
    Рисунок 5. Схема внутриклеточной локализации выбранного белка
  5. Сравнение экспрессии РНК и белка с выбранным ID приведено на рис. 6.
    RNA and protein expression
    Рисунок 6. Экспрессия РНК и белка с ID ST3GAL2
    Видно, что РНК обнаруживает экспрессию во всех тканях, в отличие от белка. Там, где белок экспрессируется, соотношение его экспрессии к экспрессии РНК варьирует.
  6. Экспрессия РНК с данным ID в различных тканях подробно приведена на рис. 7.
    RNA expression in tissues
    Рисунок 7. Экспрессия РНК ST3GAL2 в различных тканях
    Видно, что РНК экспрессируется везде, с пиками в мозжечке и скелетных мышцах.

В этом практикуме мы познакомились с ещё одним типом баз данных и увидели множество красивых картинок.