Среди всех белков Vibrio Cholerae очевидным и естественным образом для анализа был выбран холерный токсин, ибо именно благодаря ему бактерия обладает таким огрмоным эпидемиологическим значением.
Холерный токсин — мультисубъедичиный белок, он включает в себя шесть единиц: одна из них — субъединица А, которая и обладает каталитической активностью, другие пять — субъединицы В, которые обеспечивают связывание с человеческой клеткой.
Для поиска белка был использован расширенный ("Advanced") поиск в базе данных UniProtKB с использованием поиска по таксономии (Vibrio Cholerae) и ключевому слову (toxin). Запрос выдал 109 результатов, из которых 12 аннотированы Swiss-Prot, а 97 получены автоматически в TrEMBL. Была выбрана субъединица А холеного энтеротоксина (Cholera enterotoxin subunit A), ID: CHTA_VIBCH.
Субъединица состоит из двух цепей: А1 и А2. Цепь А1 связывается с пентамерным кольцом В субъединиц. Цепь А2 выполняет каталитическую функцию: АДФ-рибозилирует G белок, который активирует аденилатциклазу, которая начинает избыточно синтезировать цАМФ. Это впоследствии приводит к гиперсекреции хлоридов и дикарбонатов, за чем следует потеря жидкости.
В кластерах UniRef100 и UniRef90 последовательность этого белка является сидом и репрезентативной.
Интересно найти на UniProt белки, которые связываются с токсином. Из описания токсина мы уже знаем, что это альфа субъединицы Gs белков человека. Несмотря на то, что ссылки на UniProt этих белков уже висят, например, на википедии, мне стало интересно найти их самостоятельно.
Искать эти белки можно разными способами. В любом случае в запросе будет указан организм Homo sapiens. Например, можно попробовать искать по Gene Ontology: отметим способность связываться с GTP, а также сигнальную функцию. Получим 404 результата. Это много, что естественно. Так что добавим фильтр по расположению в клетке: в мембране. Теперь получим 238 результатов. Я мало знаю о G белках, так что не могу придумать, как еще можно было бы уточнить этот запрос и сузить число находок, не ссылаясь на название.
Ещё можно было искать по семейству белков, такой поиск даст всего 65 результатов, среди которых быстро находятся нужные нам два.
Ещё более точным оказывается поиск по названию гена — получим 29 результатов.
Но всё же самый рациональный поиск — поиск по названию, ведь оно нам уже известно. Этот запрос выдаст 23 результата, все записи (видимо) являются изоформами искомого белка. Есть две аннотированные записи: GNAS1_HUMAN и GNAS2_HUMAN, они нам и нужны.
В процессе мне стало интересно посмотреть, какой будет выдача, если искать по записи в целом, но не по названию. Получилось 13 результатов, 5 аннотированы, из них 3 — ингибиторы Gs, еще один — рецептор, связанный с Gs, и один — просто другой G белок.
Итак, мы нашли G белки, но связаны ли они с холерой? Посмотрим, поищем "cholera" по всем записям G белков. Получим 12 результатов, и все они аннотированы. Во-первых, холера действительно упоминается где-то в записях этих белков; во-вторых, она упоминается не только у наших двух Gs белков, но и у других G белков. Просмотрев записи, мы поймем, что холера упоминается в модификациях, а именно АДФ-рибозилировании, остатков аргинина этих белков, что отвечает механизму действия токсина. Видимо холерный токсин способен действовать не только на Gs белки, но именно их (или в большей мере их) дисфункция впоследствии вызывает заболевание.
А в каких белках, помимо G белков, может встретится упоминание холеры? Получим 19 результатов — не много... Из интересного, есть белки, которые действуют как активаторы для холерного токсина (ARL4D_HUMAN, ARF5_HUMAN) или способствуют его транспортировке (GP107_HUMAN).