Работа с

Uniprot

СеместрыВторой семестр • Работа с UniProt

UniProt — база данных, содержащая информацию о белках.

С помощью сервиса IDMapping я нашел идентификатор моего белка Bontoxilysin A — Q45894. Ортологичные белки я искал, используя в расширенном поиске фильтрацию по организму и имени. В итоге я выбрал Bontoxilysin A штамма Clostridium botulinum (strain Eklund 17B / Type B) и Bontoxilysin A штамма Clostridium botulinum (strain Loch Maree / Type A3).

Для этих белков я заполнил таблицу с необходимой информацией, полученной из их записей. Таблицу в формате xls можно скачать.

Для моего белка (Bontoxilysin A) я ответил на три вопроса из списка предложенных.

Какие ионы связываеются с белком?
С белком связываются ионы цинка (Zn2+). Информация об этом содержится в строке FL METAL записи.

Напишите номера и названия аминокислотных остатков, чьи боковые цепи связаны ковалентной связью.
Ковалентной связью связаны боковые цепи цистеинов 1235 и 1280 (дисульфидный мостик), информация содержится в строке FT DISULFID.

Какие аминокислотные остатки (номер, трехбуквенный код, русское название) Вы бы стали мутировать, чтобы повлиять на структурную целостность Вашего белка?
Чтобы нарушить целостность белка, я бы стал мутировать цистеины (Cys) 430 и 454, т.к. они, образуя дисульфидный мостик, соединяют легкую и тяжелую цепи белка. Информация содержится в строке FT DISULFID.

Поиск всех ортологов

Я попытался оценить, сколько ортологов моего белка содержится в базах SwissProt (аннотированная база UniProt) и TrEMBL (неаннотированная). Для этого я использовал запрос "organism:Clostridium AND name:"Botulinum neurotoxin" NOT organism:phage". Последнее условие было добавлено, т.к. в выкладке встречался ботулинический токсин бактериофага. Всего было найдено 138 белков (включая мой), из которых 14 принадлежат базе SwissProt, остальные 124 — TrEMBL. История запросов представлена в таблице 1.

Таблица 1 Запросы для вывода списка ортологов белка Bontoxilysin A

Текст запроса

Количество находок (общее/SwissProt,TrEMBL)

Причина несоответствия

1 name:"Botulinum neurotoxin" 144/14,130 В выдаче содержатся белки фагов, Phytoplasma mali и Enterococcus faecium
2 name:"Botulinum neurotoxin" AND organism:Clostridium 142/14,128 В выдаче содержатся белки фагов
3 organism:Clostridium AND name:"Botulinum neurotoxin" NOT organism:phage 138/14,124

АТФ-азный оперон

В прошлом семестре, работая с геномным браузером на сайте NCBI, мы делали предположения относительно того, какие гены входят в АТФ-азный оперон бактерии. Оперон — функциональная единица генома у прокариот, в состав которой входят цистроны (гены, единицы транскрипции), кодирующие совместно или последовательно работающие белки и объединенные под одним (или несколькими) промоторами. В этом практикуме с помощью сервиса DOOR2 я попытался определить, насколько совпадут мои ожидания с предсказаниями DOOR2. На рис.1 представлен участок с генами, кодирующими субъединицы АТФ-синтазы. Я предсказывал объединение всех генов в один оперон, в то время как сервис DOOR2 определяет первые два гена в один оперон, второй — в еще один (сомневаюсь, можно ли назвать один ген опероном), а остальные — в третий.

Рисунок 1. АТФ-азный оперон по версии DOOR2. Цветом выделены два оперона, включающие в себя гены, кодирующие субъединицы АТФ-синтазы.

Ниже приведена таблица 2 с информацией по этим двум оперонам ("оперон" из одного гена я не рассматривал).

Таблица 2. Описание двух оперонов, включающих гены, кодирующие субъединицы АТФ-синтазы.

Operon

GI

Synonym

Gene

Start

End

Strand

Length

Product

549118 226947373 CLM_0193 atpI 179935 180303 + 122 ATP synthase FO, I subunit
226947374 CLM_0194 atpB 180318 180998 + 226 FOF1 ATP synthase subunit A
549119 226947376 CLM_0196 atpF 181354 181833 + 159 FOF1 ATP synthase subunit B
226947377 CLM_0197 atpH 181836 182375 + 179 FOF1 ATP synthase subunit δ
226947378 CLM_0198 atpA 182386 183900 + 504 FOF1 ATP synthase subunit α
226947379 CLM_0199 atpG 183922 184770 + 282 FOF1 ATP synthase subunit γ
226947380 CLM_0200 atpD 184784 186175 + 463 FOF1 ATP synthase subunit β
226947381 CLM_0201 atpC 186200 186601 + 133 FOF1 ATP synthase subunit ε

Оперон белка Bontoxilysin A

С помощью сервиса DOOR2 я нашел оперон, содержащий ген, кодирующий белок Bontoxilysin A. Он представлен на рис.2. Информация о генах в опероне собрана в таблицу 3.

Рисунок 2. Оперон, в который входит ген, кодирующий белок Bontoxilysin A

 

Таблица 3. Описание оперона, содержащего ген, кодирующий белок Bontoxilysin A

Operon

GI

Synonym

Gene

Start

End

Strand

Length

Product

549231 226948034 CLM_0895 p47 951429 952679 + 416 P-47 protein
226948035 CLM_0896 ntnH 952695 956174 + 1159 botulinum neurotoxin type A2, nontoxic-nonhemagglutinin component, NTNH
226948036 CLM_0897 botA 956218 960108 + 1296 bontoxilysin A