Анализ с помощью БД Human Protein Atlas

Для данного практикума был выбран ген из предложенного списка (половина генов являются маркерами рака в различных тканях). Для анализа использовался сайт Human Protein Atlas.
Выбранный ген - HSPG2 (гепарансульфат протеоликан 2). Его вбили в поисковое поле БД Human Protein Atlas и узнали следующую информацию:

  1. Расположение: на первой хромосоме человека (координаты: 21822244 - 21937310).
  2. Название гена: HSPG2 (perlecan, PRCAN, SJS1).
  3. Белок (Uniprot): коровый белок гепарансульфат протеогликана (компонент базальной мембраны), отвечающий за отрицательный заряд на мембране. Играет роль барьера, избирательного к заряду и размерам молекул.
  4. Описание: кодирует белок перлекан, состоящий из корового белка, с которым связаны три длинные цепи глюкозаминогликанов (гепарансульфаты). Перлекан - мультидоменный протеогликан, связанный с компонентами внеклеточного матрикса (внеклеточные структуры ткани, составляющие основу соединительной ткани) и с молекулами на поверхности мембраны. Перлекан необходим для поддержания барьерной функции эндотелия сосудов. Кодируемый белок нужен для нормального развития сердца и регуляции ответа кровеносной системы на раны.
  5. Участие в биологиеском процессе: ангиогенез.
  6. Специфичность к тканям: низкая. Низкая специфичность для участков мозга[1].
  7. Кластер экспрессии в тканях: фибробласты (организация внеклеточного матрикса).
  8. Экспрессия РНК и белка в тканях: различается во всех тканях, а в тканях глаза не наблюдается экспрессии.
  9. Число транскриптов: 5.
  10. Специфичность к типам одиночных клеток: Granulosa cells (функция неизвестна), Hepatic stellate cells, Adipocytes, Endothelial cells.
  11. Нет в иммунных клетках.
  12. Прогноз рака: маркер уротелиального рака[2].
  13. Субклеточная локализация (рис.1): в нуклеоплазме, цитозоле и плазматической мембране[3].
  14. В каких тканях экспрессируется: во всех, кроме тканей мозга и глаза; больше всего в сосудах эндометрии, в сетчатке[1].
cell.png
Рис.1. Субклеточная локализация продукта гена HSPG2.

Как видно из рис.2, ген HSPG2 и его продукты экспрессируются во многих тканях. Для РНК (слева) высоки значения экспрессии в тканях органов желудочно-кишечного тракта, мочевыделительной системы, женской репродуктивной системы и в мышечных тканях. Если говорить о конкретных органах вышеуказанных систем, то в толстом кишечнике (118.4 nTPM), желудке (76.8 nTPM), мочевом пузыре (111.1 nTPM), эндометрии (153.2 nTPM), молочных желёзах (97.0 nTPM), фаллопиевых трубах (85.8 nTPM), в сердечных (143.5 nTPM), гладких (97.0 nTPM) мышцах, жировой ткани (130. 2 nTPM). Низкие значения - в сетчатке глаза (0.3 nTPM).
nTPM - нормализованный показатель экспресии, сложенный из данных РНК-секвенирования в The Human Protein Atlas (HPA) и Genotype-Tissue Expression Project (GTEx).

Высокие (по сравнению с остальными группами тканей) значения экспрессии белка в весах (справа) наблюдаются в сердечной мышце: в кардиомиоцитах средний показатель. В сетчатке глаза экспрессии не наблюдается вовсе. Другая картина наблюдается и с другими тканями, в которых высокая экспрессия РНК: низкие показатели для белка.
Вес считался как наилучшая оценка достоверного значения экспрессии, которое бралось из аннотаций.

На рис.3 показано распределение показателей экспрессии РНК и белка. В первом случае демонстрируется консенсусный датасет, получившийся в результате объединения датасетов транскриптомов HPA и GTEx.

human.png
Рис.2. Экспрессия гена и белка в органах человека.
tissue_expression.png
Рис.3. Распределение показателей экспрессии РНК (A) и белка (B) в целом.

Экспрессия в мозге человека

Как написано в разделе "Summary", исследуемый ген мало специфичен к участкам мозга.

По данным RNAseq, РНК экспрессируется в мозге, причём, больше всего в коре больших полушарий (21.5 nTPM) и в сосудистом сплетении желудочков мозга (39.2 nTPM). Экспрессии белка нет.

На рис.4 представлена гистограмма распределения уровней экспрессии РНК отдельно в участках мозга. Видно, что высокий показатель (21.5 nTPM), по сравнению с остальными участками, в коре больших полушарий, а если точнее, то в теменной доле. Низкое значение - в обонятельной луковице (0.8 nTPM). На сайте также можно посмотреть экспрессию в отдельных структурах, а также в мозге свиньи и мыши. Ещё показано сравнение показателей, предоставленных Genotype-Tissue Expression Project и FANTOM5 Project.

brain.png
Рис.4. Экспрессия РНК в мозге человека.

Кластеризация и корреляция

Данные RNAseq использовали, чтобы организовать отдельные генные кластеры по значениям экспрессии РНК в тканях. Ген HSPG2 входит в кластер 57 (фибробласты - организация внеклеточного матрикса) вместе с 15 другими генами. Их названия и коэффициент корреляции представлены на рис.5.

cluster.png
Рис.5. Ближайшие гены к HSPG2, принадлежащие кластеру 57.

По информации, полученной из базы данных, HSPG2 - маркер уротелиального рака, поэтому интересно было взглянуть на выживаемость при данном заболевании. Для этого сделали следующее: разделили 406 пациентов на две группы в зависимости от уровня экспрессии гена: низкий (168 человек) или высокий (238 человек). Провели корреляцию между экспрессией мРНК и выживаемостью пациента. На рис.6 представлен такой график. По оси X - время от постановки диагноза, по оси Y - вероятность того, что человек выживет. Синяя кривая - с низкой экспрессией, розовая - с высокой. Заметим, что пациенты из первой группы имеют больше шансов выжить с раком, чем из второй.

Можно добавить, что пациенты, у которых поставили диагноз, с третьей и более стадиями заболевания живут не очень долго: примерно, 3-3,5 года, однако есть малое количество людей, которые проживают дольше.

pathology.png
Рис.6. Выживаемость при уротелиальном раке.

С помощью методов флуоресцентой микроскопии была выявлена локализация продукта гена HSPG2 в клетках (рис.7). Здесь показаны три клеточные линии с разным уровнем экспрессии мРНК: A-431 (44.0 nTPM), U-2 OS (51.8 nTPM), U-251 MG (2.3 nTPM). На фотографиях зелёным цветом показан таргетный белок, синим - ядро.

Показано, что белок находится в нуклеоплазме, плазматической мембране и цитоплазме.

cell_lines.png
Рис.7. Локализация белка - продукта HSPG2.