Практикум 6
Резюме: В ходе работы над этим практикумом был проанализрован доставшийся мне набор генов (всего 22 гена) с использованием баз данных GO (сервиса PANTHER), Reactome, STRING и Human Protein Atlas
1. PANTHER: Анализ обогащения терминами GO
Сперва я провел анализ обогащения терминами GO для генов из доставшегося мне списка. База данных GO представляет собой граф биологических терминов, соединенных различными отношениями. PANTHER позволяет проводить анализ обогащения терминами. Его цель - обнаружить перепредставленность каких-то характеристик в данном наборе генов по сравнению со случайный набором (со средним по всем генам). Анализ проводился с использованием точного теста Фишера с поправкой Бонферрони на множественные сравнения (Таблица 1, полные результаты).
Таблица 1. Результаты анализа обогащения терминами (участие в биологических процессах), 12 лучших находок

Анализ обогащения показал, что в доставшемся мне наборе генов много тех, продукты которых участвуют в метаболических процессах, связанных с углеводами. Термины "процессы биосинтеза олигосахаридов", "фукозилирование", а также названия некоторых генов (ABO, RHD) наводят на мысль о группах крови (странно, что в GO нет соответствующего термина). Чтобы проверить эту догадку, я решил воспользоваться базой данных Reactome
2. Reactome
Reactome - это база данных биологических путей (сигналинг, метаболизм, апоптоз и др.) с очень красивыми инструментами визуализации. Reactome также позволяет анализировать набор генов (наверное, это тоже можно назвать анализом обогащением терминами) по участию их продуктов в pathways. Анализ моего списка генов показал, что все они (их продукты) участвуют как раз в Blood group systems biosynthesis, ура (Рис. 1).

Итак, в доставшемся мне списке генов есть:
RHD и RHCE - кодируют мембранные белки эритроцитов (гомологичны аммониевым транспортерам, но там не все ясно [ссылка]). Ответственны за резус-систему групп крови (почему гены в ядрышке я не знаю, видимо ошибка).
FUT1, FUT2, B3GALTs - гены, кодирующие ферменты, ответственные за синтез олигосахаридных предшественников антигенов систем ABO и Lewis (в обеих системах, антигены, детерминирующие группу крови - это олигосахариды на поверхности эритроцитов / плавающие в плазме)
ABO - фермент из класса трансфераз (как и все остальные, кроме резусов). В зависимости от варианта (аллеля) катализирует реакцию образования A или B антигена системы ABO
Все остальные - гликозилтрансферазы, участвующие в синтезе антигенов системы Lewis
Все белки, кроме резусов, локализованы в мембране аппарата Гольджи
Что еще? На схеме также видно, что антигены Lewis - секретируемы. На самом, деле, эти антигены синтезируются не эритроцитами, а другими клетками (какими - узнаете в пункте 5 ), а затем, либо включаются в состав мембран клеток крови (клетки модифицируют ими мембранные липиды или белки), либо просто плавают в крови и других жидкостях организма. Антигены ABO, могут синтезироваться самими Red Blood Cells (antigen-RBC на схеме), а могут секретироваться другими клетками (antigen-sec(retory) на схеме) [источник].
3. STRING

Чтобы дополнительно проиллюстрировать отношения между белками я решил воспользоваться сервисом STRING. STRING — это база данных и онлайн-сервис для анализа и визуализации взаимодействий между белками, объединяющий информацию из различных источников. Полученная network показана на Рис. 3. Белки-резусы обособляются от всех остальных, что неудивительно, так как резус-система групп кровт никак не связана с Lewis и ABO, а пути биосинтеза антигенов ABO и Lewis тесно переплетены. Большинство связей - это textmining, то есть эти белки часто вместе упоминаются в публикациях (а резусы обычно отдельно), что, тоже неудивительно. Больше всего меня заинтересовали светлофиолетовые связи - по гомологии. Выделяется несколько групп гомологичных белков (не знаю, можно ли назвать это паралогическими группами??) - резусы, B3GALTs (1, 2, 5), ST6GALNAC6 и ST3GAL3, некоторые FUTs. Возможно, другие белки с похожими названиями тоже входят в эти группы гомологов, просто у STRING нет достаточного подтверждения этому, ну, либо, они похоже называются просто потому что в одном процессе участвуют.
4. Genome Browser

Genome Browser - это сервис, предоставляющий "интерактивную карту" человеческого (и не только) генома. В Genome Browser я решил посмотреть на ген FUT3. Оказалось, что очень рядом с ним располагаются гены FUT5 и FUT6 (остальные FUTs не рядом). Мне кажется, что такое соседство может свидетельствовать о том, что эти гены образовались в результате относительно недавних дупликаций: разошлись не так давно, поэтому не успели разойтись "пространственно". Я очень не уверен в этом рассуждении, но вот, хотел показать, что они рядом, возможно, это говорит о том, что они более родственны друг другу, чем остальным FUTам (конечно, надо подтверждать выравниваниями-деревьями).
5. Human Protein Atlas
Human Protein Atlas — это база данных, содержащая различную информацию о человеческих белках - распределение экспрессии по клеточным линиям, тканям и органах, субклеточную локализацию, взаимосвязь с раком и проч.
С помощью Human Protein Atlas я, в первую очередь, захотел узнать, какие ткани/органы секретируют антигены Lewisa. Для этого я выбрал продукт гена FUT3, потому что у него был Reliability score - Supported в разделе TISSUE (у остальных - хуже). Название белка -- Fucosyltransferase 3.
ТАКИМ ОБРАЗОМ, продукты всех генов из доставшегося мне набора участвуют в биосинтезе трех групп крови: Резус, AB0 и системы Льюиса. Все белки, кроме резусов - гликозилтрансферазы, ответственные за различные стадии синтеза олигосахаридных антигенов. Больше всего мне было интересно разобраться в пути синтеза антигенов Льюиса, потому что раньше я не слышал об этой системе. Я выяснил тканевую локализацию пути синтеза антигенов Льюиса и немного посмотрел на эволюционные связи между белками-участниками этих процессов, выявив 4 группы паралогов.