Создание выборки белков с одинаковыми функциями

Задача - создать выборку белков, выполняющих ту же функцию, что и Железосодержащий белок сукцинат дегидрогеназы (E. coli K-12)

Часть 1. Краткое описание прототипа по данным банка аминокислотных последовательностей Swiss-Prot

  Метка поля Запись
Внутренний уникальный постоянный идентификатор документа AC P07014
Стандартное имя последовательности (идентификатор последовательности) ID DHSB_ECOLI
Название белка, отражающее его функции DE Succinate dehydrogenase iron-sulfur protein (EC 1.3.99.1)
Дата создания документа DT 01-APR-1988 (Rel. 07, Created)
Дата последнего исправления аннотации DT 15-MAR-2004 (Rel. 43, Last annotation update)
Название организма OS Escherichia coli
Полное название таксона OC Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Escherichia
Длина последовательности SQ 238
Молекулярная масса белка, а.е.м. SQ 26770
Число публикаций, использованных при создании документа RN 5
Название журнала с самой свежей публикацией RL Science 277:1453-1474(1997)
Описание вторичной структуры FT Есть, для каждого участка указано № начального и конечного АКО, и вид структуры на этом участке - turn, strand, spiral.
Что содержит поле комментариев? CC Функции, каталитическая активность, кофактор, путь реакций, в которых участвует (Tricarboxylic acid cycle), субъединицы и схожие последовательности. Потом ©'ы.
Какие особенности последовательности указаны? FT Имеется 11 железосерных кластеров 3х видов (Iron Sulphur 1,2,3)
Идентификатор файла PDB DR 1NEK, 1NEN


Часть 2. Описание процедуры составления выборки

Поиск производился с помощью системы SRS (Sequence Retrieval System).

Был выбран банк данных UniProt. Критерии поиска: в поле Description указано содержимое поля DE из вышеуказанной таблицы (один раз Succinate ... , другой ЕС 1.3.99.1); в поле Species - 'Escherichia coli | Vibrio cholerae | Yersinia pestis'. C данными параметрами найдено 4 документа: DHSB_ECOLI, Q9KQB2, Q8ZH03, Q8FJT9, из которых нам нужны три первых. Далее при осмотре найденного из выборки изымалось бы (если бы было) всё, что не было Succinate ..., т.к. поиск давал также всё, что так или иначе связано с моим белком (а потому имело Succinate ... в названии).

Также белок искался по полю Taxonomy вместо Species. Как оказалось, у Архей (Archaea) его вообще нет; среди Бактерий (Bacteria)найдено 58 белков с этим названием; и у Эукарот (Eukaryota) 13.

Непосредственный код запросов


Часть 3. Описание выборки

В этой части было задание найти и добавить по 3 белка в выборку к 4м выше описанным со следующими параметрами по таксономии:

  • Из грам-положительных бактерий (Firmicutes) - всего найдено 7.
  • Из других бактерий (не из Firmicutes и не из гамма-протеобактерий) - найдено 46.
  • Из Архей (Archaea) - не найдено.
  • Из Эукариот (Eucaryota) - найдено 13.

  •  № IDACОрганизмТаксон
    1 DHSB_ECOLI P07014 ESCHERICHIA COLI BACTERIA
    PROTEOBACTERIA
    GAMMAPROTEOBACTERIA
    ENTEROBACTERIALES
    ENTEROBACTERIACEAE
    ESCHERICHIA
    2 Q9KQB2 Q9KQB2 VIBRIO CHOLERAE BACTERIA
    PROTEOBACTERIA
    GAMMAPROTEOBACTERIA
    VIBRIONALES
    VIBRIONACEAE
    VIBRIO
    3 Q8ZH03 Q8ZH03 YERSINIA PESTIS BACTERIA
    PROTEOBACTERIA
    GAMMAPROTEOBACTERIA
    ENTEROBACTERIALES
    ENTEROBACTERIACEAE
    YERSINIA
    4 Q8FJT9 Q8FJT9 ESCHERICHIA COLI O6 BACTERIA
    PROTEOBACTERIA
    GAMMAPROTEOBACTERIA
    ENTEROBACTERIALES
    ENTEROBACTERIACEAE
    ESCHERICHIA
    5 DHSB_BACSU P08066 BACILLUS SUBTILIS BACTERIA
    FIRMICUTES
    BACILLALES
    BACILLACEAE
    BACILLUS
    6 Q99UV7 Q99UV7 STAPHYLOCOCCUS AUREUS STRAIN N315
    STAPHYLOCOCCUS AUREUS STRAIN MW2
    BACTERIA
    FIRMICUTES
    BACILLALES
    STAPHYLOCOCCUS
    7 Q8EPJ0 Q8EPJ0 OCEANOBACILLUS IHEYENSIS BACTERIA
    FIRMICUTES
    BACILLALES
    BACILLACEAE
    OCEANOBACILLUS
    8 DHSB_CAEEL Q09545 CAENORHABDITIS ELEGANS EUKARYOTA
    METAZOA
    NEMATODA
    CHROMADOREA
    RHABDITIDA
    RHABDITOIDEA
    RHABDITIDAE
    PELODERINAE
    CAENORHABDITIS
    9 DHSB_CYACA P48933 CYANIDIUM CALDARIUM EUKARYOTA
    RHODOPHYTA
    BANGIOPHYCEAE
    PORPHYRIDIALES
    PORPHYRIDIACEAE
    CYANIDIUM
    10 DHSB_DROME P21914
    Q9V9A0
    DROSOPHILA MELANOGASTER FRUIT FLY EUKARYOTA
    METAZOA
    ARTHROPODA
    HEXAPODA
    INSECTA
    PTERYGOTA
    NEOPTERA
    ENDOPTERYGOTA
    DIPTERA
    BRACHYCERA
    MUSCOMORPHA
    EPHYDROIDEA
    DROSOPHILIDAE
    DROSOPHILA
    11 DHSB_CHOCR P48932 CHONDRUS CRISPUS CARRAGHEEN EUKARYOTA
    RHODOPHYTA
    FLORIDEOPHYCEAE
    GIGARTINALES
    GIGARTINACEAE
    CHONDRUS