Задача - создать выборку белков, выполняющих ту же функцию, что и Железосодержащий белок сукцинат дегидрогеназы (E. coli K-12)
Метка поля | Запись | |
---|---|---|
Внутренний уникальный постоянный идентификатор документа | AC | P07014 |
Стандартное имя последовательности (идентификатор последовательности) | ID | DHSB_ECOLI |
Название белка, отражающее его функции | DE | Succinate dehydrogenase iron-sulfur protein (EC 1.3.99.1) |
Дата создания документа | DT | 01-APR-1988 (Rel. 07, Created) |
Дата последнего исправления аннотации | DT | 15-MAR-2004 (Rel. 43, Last annotation update) |
Название организма | OS | Escherichia coli |
Полное название таксона | OC | Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Escherichia |
Длина последовательности | SQ | 238 |
Молекулярная масса белка, а.е.м. | SQ | 26770 |
Число публикаций, использованных при создании документа | RN | 5 |
Название журнала с самой свежей публикацией | RL | Science 277:1453-1474(1997) |
Описание вторичной структуры | FT | Есть, для каждого участка указано № начального и конечного АКО, и вид структуры на этом участке - turn, strand, spiral. |
Что содержит поле комментариев? | CC | Функции, каталитическая активность, кофактор, путь реакций, в которых участвует (Tricarboxylic acid cycle), субъединицы и схожие последовательности. Потом ©'ы. |
Какие особенности последовательности указаны? | FT | Имеется 11 железосерных кластеров 3х видов (Iron Sulphur 1,2,3) |
Идентификатор файла PDB | DR | 1NEK, 1NEN |
Поиск производился с помощью системы SRS (Sequence Retrieval System).
Был выбран банк данных UniProt. Критерии поиска: в поле Description указано содержимое поля DE из вышеуказанной таблицы (один раз Succinate ... , другой ЕС 1.3.99.1); в поле Species - 'Escherichia coli | Vibrio cholerae | Yersinia pestis'. C данными параметрами найдено 4 документа: DHSB_ECOLI, Q9KQB2, Q8ZH03, Q8FJT9, из которых нам нужны три первых. Далее при осмотре найденного из выборки изымалось бы (если бы было) всё, что не было Succinate ..., т.к. поиск давал также всё, что так или иначе связано с моим белком (а потому имело Succinate ... в названии).
Также белок искался по полю Taxonomy вместо Species. Как оказалось, у Архей (Archaea) его вообще нет; среди Бактерий (Bacteria)найдено 58 белков с этим названием; и у Эукарот (Eukaryota) 13.
Непосредственный код запросов
В этой части было задание найти и добавить по 3 белка в выборку к 4м выше описанным со следующими параметрами по таксономии:
№ | ID | AC | Организм | Таксон |
---|---|---|---|---|
1 | DHSB_ECOLI | P07014 | ESCHERICHIA COLI | BACTERIA PROTEOBACTERIA GAMMAPROTEOBACTERIA ENTEROBACTERIALES ENTEROBACTERIACEAE ESCHERICHIA |
2 | Q9KQB2 | Q9KQB2 | VIBRIO CHOLERAE | BACTERIA PROTEOBACTERIA GAMMAPROTEOBACTERIA VIBRIONALES VIBRIONACEAE VIBRIO |
3 | Q8ZH03 | Q8ZH03 | YERSINIA PESTIS | BACTERIA PROTEOBACTERIA GAMMAPROTEOBACTERIA ENTEROBACTERIALES ENTEROBACTERIACEAE YERSINIA |
4 | Q8FJT9 | Q8FJT9 | ESCHERICHIA COLI O6 | BACTERIA PROTEOBACTERIA GAMMAPROTEOBACTERIA ENTEROBACTERIALES ENTEROBACTERIACEAE ESCHERICHIA |
5 | DHSB_BACSU | P08066 | BACILLUS SUBTILIS | BACTERIA FIRMICUTES BACILLALES BACILLACEAE BACILLUS |
6 | Q99UV7 | Q99UV7 | STAPHYLOCOCCUS AUREUS STRAIN N315 STAPHYLOCOCCUS AUREUS STRAIN MW2 |
BACTERIA FIRMICUTES BACILLALES STAPHYLOCOCCUS |
7 | Q8EPJ0 | Q8EPJ0 | OCEANOBACILLUS IHEYENSIS | BACTERIA FIRMICUTES BACILLALES BACILLACEAE OCEANOBACILLUS |
8 | DHSB_CAEEL | Q09545 | CAENORHABDITIS ELEGANS | EUKARYOTA METAZOA NEMATODA CHROMADOREA RHABDITIDA RHABDITOIDEA RHABDITIDAE PELODERINAE CAENORHABDITIS |
9 | DHSB_CYACA | P48933 | CYANIDIUM CALDARIUM | EUKARYOTA RHODOPHYTA BANGIOPHYCEAE PORPHYRIDIALES PORPHYRIDIACEAE CYANIDIUM |
10 | DHSB_DROME | P21914 Q9V9A0 |
DROSOPHILA MELANOGASTER FRUIT FLY | EUKARYOTA METAZOA ARTHROPODA HEXAPODA INSECTA PTERYGOTA NEOPTERA ENDOPTERYGOTA DIPTERA BRACHYCERA MUSCOMORPHA EPHYDROIDEA DROSOPHILIDAE DROSOPHILA |
11 | DHSB_CHOCR | P48932 | CHONDRUS CRISPUS CARRAGHEEN | EUKARYOTA RHODOPHYTA FLORIDEOPHYCEAE GIGARTINALES GIGARTINACEAE CHONDRUS |