Практикум 6

Резюме: В ходе работы над этим практикумом был проанализрован доставшийся мне набор генов (всего 22 гена) с использованием баз данных GO (сервиса PANTHER), Reactome, STRING и Human Protein Atlas


1. PANTHER: Анализ обогащения терминами GO

Сперва я провел анализ обогащения терминами GO для генов из доставшегося мне списка. База данных GO представляет собой граф биологических терминов, соединенных различными отношениями. PANTHER позволяет проводить анализ обогащения терминами. Его цель - обнаружить перепредставленность каких-то характеристик в данном наборе генов по сравнению со случайный набором (со средним по всем генам). Анализ проводился с использованием точного теста Фишера с поправкой Бонферрони на множественные сравнения (Таблица 1, полные результаты).

Таблица 1. Результаты анализа обогащения терминами (участие в биологических процессах), 12 лучших находок

Анализ обогащения показал, что в доставшемся мне наборе генов много тех, продукты которых участвуют в метаболических процессах, связанных с углеводами. Термины "процессы биосинтеза олигосахаридов", "фукозилирование", а также названия некоторых генов (ABO, RHD) наводят на мысль о группах крови (странно, что в GO нет соответствующего термина). Чтобы проверить эту догадку, я решил воспользоваться базой данных Reactome

2. Reactome

Reactome - это база данных биологических путей (сигналинг, метаболизм, апоптоз и др.) с очень красивыми инструментами визуализации. Reactome также позволяет анализировать набор генов (наверное, это тоже можно назвать анализом обогащением терминами) по участию их продуктов в pathways. Анализ моего списка генов показал, что все они (их продукты) участвуют как раз в Blood group systems biosynthesis, ура (Рис. 1).

Рис.1. Биосинтез систем групп крови, Reactome. На этой красивой схеме есть продукты всех доставшихся мне генов (ну, наверное, они по этому принципу и были сгруппированы). Бирюзовые прямоугольники - белки (в данном случае продукты генов из списка), голубые прямоугольниуи с двойной обводкой - группы белков (осуществляющие катализ одной реакции)

Рис. 2. Разделение схемы на рис. 1 на пути синтеза разных систем групп крови

Итак, в доставшемся мне списке генов есть:
RHD и RHCE - кодируют мембранные белки эритроцитов (гомологичны аммониевым транспортерам, но там не все ясно [ссылка]). Ответственны за резус-систему групп крови (почему гены в ядрышке я не знаю, видимо ошибка).
FUT1, FUT2, B3GALTs - гены, кодирующие ферменты, ответственные за синтез олигосахаридных предшественников антигенов систем ABO и Lewis (в обеих системах, антигены, детерминирующие группу крови - это олигосахариды на поверхности эритроцитов / плавающие в плазме)
ABO - фермент из класса трансфераз (как и все остальные, кроме резусов). В зависимости от варианта (аллеля) катализирует реакцию образования A или B антигена системы ABO
Все остальные - гликозилтрансферазы, участвующие в синтезе антигенов системы Lewis
Все белки, кроме резусов, локализованы в мембране аппарата Гольджи

Что еще? На схеме также видно, что антигены Lewis - секретируемы. На самом, деле, эти антигены синтезируются не эритроцитами, а другими клетками (какими - узнаете в пункте 5 ), а затем, либо включаются в состав мембран клеток крови (клетки модифицируют ими мембранные липиды или белки), либо просто плавают в крови и других жидкостях организма. Антигены ABO, могут синтезироваться самими Red Blood Cells (antigen-RBC на схеме), а могут секретироваться другими клетками (antigen-sec(retory) на схеме) [источник].


3. STRING

Рис. 3. STRING network, иллюстрирующая взаимосвязи между продуктами выданных мне генов; светло-желтые линии - textmining (совместные упоминания в литературе), фиолетовые линии связывают гомологичные белки, голубые - обозначают взаимодействия согласно курируемым базам данным

Чтобы дополнительно проиллюстрировать отношения между белками я решил воспользоваться сервисом STRING. STRING — это база данных и онлайн-сервис для анализа и визуализации взаимодействий между белками, объединяющий информацию из различных источников. Полученная network показана на Рис. 3. Белки-резусы обособляются от всех остальных, что неудивительно, так как резус-система групп кровт никак не связана с Lewis и ABO, а пути биосинтеза антигенов ABO и Lewis тесно переплетены. Большинство связей - это textmining, то есть эти белки часто вместе упоминаются в публикациях (а резусы обычно отдельно), что, тоже неудивительно. Больше всего меня заинтересовали светлофиолетовые связи - по гомологии. Выделяется несколько групп гомологичных белков (не знаю, можно ли назвать это паралогическими группами??) - резусы, B3GALTs (1, 2, 5), ST6GALNAC6 и ST3GAL3, некоторые FUTs. Возможно, другие белки с похожими названиями тоже входят в эти группы гомологов, просто у STRING нет достаточного подтверждения этому, ну, либо, они похоже называются просто потому что в одном процессе участвуют.


4. Genome Browser

Рис. 4. Скрин из геномного браузера, фрагмент 19 хромосомы - ген FUT3 и его соседи

Genome Browser - это сервис, предоставляющий "интерактивную карту" человеческого (и не только) генома. В Genome Browser я решил посмотреть на ген FUT3. Оказалось, что очень рядом с ним располагаются гены FUT5 и FUT6 (остальные FUTs не рядом). Мне кажется, что такое соседство может свидетельствовать о том, что эти гены образовались в результате относительно недавних дупликаций: разошлись не так давно, поэтому не успели разойтись "пространственно". Я очень не уверен в этом рассуждении, но вот, хотел показать, что они рядом, возможно, это говорит о том, что они более родственны друг другу, чем остальным FUTам (конечно, надо подтверждать выравниваниями-деревьями).


5. Human Protein Atlas

Human Protein Atlas — это база данных, содержащая различную информацию о человеческих белках - распределение экспрессии по клеточным линиям, тканям и органах, субклеточную локализацию, взаимосвязь с раком и проч. С помощью Human Protein Atlas я, в первую очередь, захотел узнать, какие ткани/органы секретируют антигены Lewisa. Для этого я выбрал продукт гена FUT3, потому что у него был Reliability score - Supported в разделе TISSUE (у остальных - хуже). Название белка -- Fucosyltransferase 3.

Рис. 5. Распределение уровней экспрессии Fucosyltransferase 3 (FUT3) по органам
Тадам, как видно на Рис. 4, больше всего белка Fucosyltransferase 3 экспрессируется в пищеварительной системе (синие столбики). Наибольший уровень экспрессии - в двеннадцатиперстной кишке, а именно в клетках Панета (можно узнать, наведя курсор на столбик), основная функция которых - секреция антимикробных агентов (типа дефензимов). Насколько я понимаю, секрецию антигенов Льюиса тоже можно назвать компонентом антимикробной защиты, так как они как-то там могут облеплять патоген и влиять на его взаимодействие с клетками слизистых. Так что высокий уровень экспрессии основного участника их синтеза FUT3 вполне соотносится с основной функций клеток Панета. Вот такие пироги.


ТАКИМ ОБРАЗОМ, продукты всех генов из доставшегося мне набора участвуют в биосинтезе трех групп крови: Резус, AB0 и системы Льюиса. Все белки, кроме резусов - гликозилтрансферазы, ответственные за различные стадии синтеза олигосахаридных антигенов. Больше всего мне было интересно разобраться в пути синтеза антигенов Льюиса, потому что раньше я не слышал об этой системе. Я выяснил тканевую локализацию пути синтеза антигенов Льюиса и немного посмотрел на эволюционные связи между белками-участниками этих процессов, выявив 4 группы паралогов.