UniProt — база данных, содержащая информацию о белках.
С помощью сервиса IDMapping я нашел идентификатор моего белка Bontoxilysin A — Q45894. Ортологичные белки я искал, используя в расширенном поиске фильтрацию по организму и имени. В итоге я выбрал Bontoxilysin A штамма Clostridium botulinum (strain Eklund 17B / Type B) и Bontoxilysin A штамма Clostridium botulinum (strain Loch Maree / Type A3).
Для этих белков я заполнил таблицу с необходимой информацией, полученной из их записей. Таблицу в формате xls можно скачать.
Для моего белка (Bontoxilysin A) я ответил на три вопроса из списка предложенных.
Какие ионы связываеются с белком? С белком связываются ионы цинка (Zn2+). Информация об этом содержится в строке FL METAL записи.
Напишите номера и названия аминокислотных остатков, чьи боковые цепи связаны ковалентной связью. Ковалентной связью связаны боковые цепи цистеинов 1235 и 1280 (дисульфидный мостик), информация содержится в строке FT DISULFID.
Какие аминокислотные остатки (номер, трехбуквенный код, русское название) Вы бы стали мутировать, чтобы повлиять на структурную целостность Вашего белка? Чтобы нарушить целостность белка, я бы стал мутировать цистеины (Cys) 430 и 454, т.к. они, образуя дисульфидный мостик, соединяют легкую и тяжелую цепи белка. Информация содержится в строке FT DISULFID.
Я попытался оценить, сколько ортологов моего белка содержится в базах SwissProt (аннотированная база UniProt) и TrEMBL (неаннотированная). Для этого я использовал запрос "organism:Clostridium AND name:"Botulinum neurotoxin" NOT organism:phage". Последнее условие было добавлено, т.к. в выкладке встречался ботулинический токсин бактериофага. Всего было найдено 138 белков (включая мой), из которых 14 принадлежат базе SwissProt, остальные 124 — TrEMBL. История запросов представлена в таблице 1.
Таблица 1 Запросы для вывода списка ортологов белка Bontoxilysin A
№ |
Текст запроса |
Количество находок (общее/SwissProt,TrEMBL) |
Причина несоответствия |
1 | name:"Botulinum neurotoxin" | 144/14,130 | В выдаче содержатся белки фагов, Phytoplasma mali и Enterococcus faecium |
2 | name:"Botulinum neurotoxin" AND organism:Clostridium | 142/14,128 | В выдаче содержатся белки фагов |
3 | organism:Clostridium AND name:"Botulinum neurotoxin" NOT organism:phage | 138/14,124 |
В прошлом семестре, работая с геномным браузером на сайте NCBI, мы делали предположения относительно того, какие гены входят в АТФ-азный оперон бактерии. Оперон — функциональная единица генома у прокариот, в состав которой входят цистроны (гены, единицы транскрипции), кодирующие совместно или последовательно работающие белки и объединенные под одним (или несколькими) промоторами. В этом практикуме с помощью сервиса DOOR2 я попытался определить, насколько совпадут мои ожидания с предсказаниями DOOR2. На рис.1 представлен участок с генами, кодирующими субъединицы АТФ-синтазы. Я предсказывал объединение всех генов в один оперон, в то время как сервис DOOR2 определяет первые два гена в один оперон, второй — в еще один (сомневаюсь, можно ли назвать один ген опероном), а остальные — в третий.
Рисунок 1. АТФ-азный оперон по версии DOOR2. Цветом выделены два оперона, включающие в себя гены, кодирующие субъединицы АТФ-синтазы.
Ниже приведена таблица 2 с информацией по этим двум оперонам ("оперон" из одного гена я не рассматривал).
Таблица 2. Описание двух оперонов, включающих гены, кодирующие субъединицы АТФ-синтазы.
Operon |
GI |
Synonym |
Gene |
Start |
End |
Strand |
Length |
Product |
549118 | 226947373 | CLM_0193 | atpI | 179935 | 180303 | + | 122 | ATP synthase FO, I subunit |
226947374 | CLM_0194 | atpB | 180318 | 180998 | + | 226 | FOF1 ATP synthase subunit A | |
549119 | 226947376 | CLM_0196 | atpF | 181354 | 181833 | + | 159 | FOF1 ATP synthase subunit B |
226947377 | CLM_0197 | atpH | 181836 | 182375 | + | 179 | FOF1 ATP synthase subunit δ | |
226947378 | CLM_0198 | atpA | 182386 | 183900 | + | 504 | FOF1 ATP synthase subunit α | |
226947379 | CLM_0199 | atpG | 183922 | 184770 | + | 282 | FOF1 ATP synthase subunit γ | |
226947380 | CLM_0200 | atpD | 184784 | 186175 | + | 463 | FOF1 ATP synthase subunit β | |
226947381 | CLM_0201 | atpC | 186200 | 186601 | + | 133 | FOF1 ATP synthase subunit ε |
С помощью сервиса DOOR2 я нашел оперон, содержащий ген, кодирующий белок Bontoxilysin A. Он представлен на рис.2. Информация о генах в опероне собрана в таблицу 3.
Рисунок 2. Оперон, в который входит ген, кодирующий белок Bontoxilysin A
Таблица 3. Описание оперона, содержащего ген, кодирующий белок Bontoxilysin A
Operon |
GI |
Synonym |
Gene |
Start |
End |
Strand |
Length |
Product |
549231 | 226948034 | CLM_0895 | p47 | 951429 | 952679 | + | 416 | P-47 protein |
226948035 | CLM_0896 | ntnH | 952695 | 956174 | + | 1159 | botulinum neurotoxin type A2, nontoxic-nonhemagglutinin component, NTNH | |
226948036 | CLM_0897 | botA | 956218 | 960108 | + | 1296 | bontoxilysin A |