SRS
В данной работе рассмотрены некоторые особенности поисковой системы SRS на примере поиска информации о белке PDXS_BACSU и гомологичных белках.Особенности аминокислотной последовательности PDXS_BACSU (ссылка на описание белка в SRS)
Полная аминокислотная последовательность белка представлена в файле pdxs_bacsu.fasta. Далее представлены некоторые ее особенности.
1. В начальной позиции в последовательности указан метионин (М). В процессе биосинтеза при созревании белка метионин удаляется.
2. Цепь содержит 3 так называемых поворота (turn), их образуют следующие участки:
- 16-19 аминокислотные остатки: MQKG
- 152-154 аминокислотные остатки: PGT
- 257-259 аминокислотные остатки: HFT
3. В структуру белка входят типичные альфа-спирали и бета-тяжи (подробнее о них можно прочесть в работе о внутримолекулярных взаимодействиях).
4. Интересной особенностью представляется наличие места «конфликта» (conflict) цепи, которая имеет форму конуса. 30-ый аминокислотный остаток Q (глутамат), возможно, отвечает за образование «дна» конусовидной цепи, как показано на рис. 1.
Рис. 1. Общий вид конусовидной цепи А (в общей структуре белка) с местом «конфликта» – 30 аминокислотным остатком (Q, выделен красным) – в основании цепи.
Список PDB-структур белка:
- • 2NV1 (ссылка на pdb-файл поисковой системы SRS);
- • 2NV1 (ссылка на pdb-файл поисковой системы SRS);
Полноразмерные белки из Firmicutes, выполняющие функцию сходную с функцией белка PDXS_BACSU можно найти с помощью поисковой системы SRS, задав запросы, представленные в таблице 1.
Таблица 1. Функция белка и запросы, необходимые для поиска других белков с подобной функцией.
Формулировка функции белка | Строка запроса | Количество найденных документов |
---|---|---|
pyridoxal byosynthesis | (([swissprot-Description:pyridoxal*] & [swissprot-Description:*synthesis*]) | [swissprot-Description:pyridoxal *synthesis*]) | 200 |
pyridoxal byosynthesis (только полноразмерные последовательности) | (([swissprot-Description:pyridoxal*] & [swissprot-Description:*synthesis*]) | [swissprot-Description:pyridoxal *synthesis*] ! [swissprot-Description:fragments*]) | 200 |
pyridoxal byosynthesis lyase | ((([swissprot-Description:pyridoxal*] & [swissprot-Description:*synthesis*]) & [swissprot-Description:lyase*]) | [swissprot-Description:pyridoxal *synthesis lyase*]) | 190 |
Последовательности десяти белков, гомологичных PDXS_BACSU, выбраны из списка результатов, полученных с помощью третьего запроса, и представлены в файле seq_pdxs.fasta
В SRS можно получить определенные данные, в которых нуждается пользователь, для любых последовательностей. Так в ходе настоящей работы была получена таблица с записями 10-ти гомологов PDXS_BACSU с указанием их AC (accession number), англоязычного описания и названия органимов, которые имеют данные белки. Результат представлен ниже.
Таблица 2. Некоторая информация SwissProt о 10 гомологах PDXS_BACSU.
Номер записи | Название записи в SwissProt | AC | Англоязычное описание (Description) | ID | Организм (species) | Длина последовательности (sequence length) |
1 | CAS1_SOLTU | Q76MX2 | Bifunctional L-3-cyanoalanine synthase/cysteine synthase 1, mitochondrial; | PCAS-1 | Solanum tuberosum (Potato). | 351 |
2 | CGL_ARATH | F4K5T2 | Bifunctional cystathionine gamma-lyase/cysteine synthase; | DES1 | Arabidopsis thaliana (Mouse-ear cress). | 323 |
3 | COBD_SALTY | P97084 | Threonine-phosphate decarboxylase; | cobD | Salmonella typhimurium (strain LT2 / SGSC1412 / ATCC 700720). | 364 |
4 | CORI3_ARATH | Q9SUR6 | Cystine lyase CORI3; | CORI3 | Arabidopsis thaliana (Mouse-ear cress). | 422 |
5 | CYSC1_ARATH | Q9S757 | Bifunctional L-3-cyanoalanine synthase/cysteine synthase C1, mitochondrial; | CYSC1 | Arabidopsis thaliana (Mouse-ear cress). | 368 |
6 | CYSC_SPIOL | Q43153 | Bifunctional L-3-cyanoalanine synthase/cysteine synthase, mitochondrial; | CYSC | Spinacia oleracea (Spinach). | 368 |
7 | CYSO_AERPE | Q9YBL2 | Protein CysO; | cysO | Aeropyrum pernix (strain ATCC 700893 / DSM 11879 / JCM 9820 / NBRC 100138 / K1). | 389 |
8 | DCDA_ECOLI | P00861 | Diaminopimelate decarboxylase; | lysA | Escherichia coli (strain K12). | 420 |
9 | DCE1_HUMAN | Q99259 | Glutamate decarboxylase 1; | GAD1 | Homo sapiens (Human). | 594 |
10 | DCHS_DROME | Q05733 | Histidine decarboxylase; | Hdc | Drosophila melanogaster (Fruit fly). | 847 |
"Taxonomy" в Swissprot
В поиске по таксонам работает выдача возможных вариантов названия таксон, имеющихся в базе данных, начинающихся на введенную последовательность. В работе был получен список таксонов, которые начинаются на "bacil" (запрос "bacil*" в поле "List values").Полученный список:
- bacillaceae
- bacillales
- bacillariaceae
- bacillariales
- bacillariophyceae
- bacillariophycidae
- bacillariophyta
- bacilli
- bacillus
Количество записей в банке Swissprot, описывающих белки из рода Bacillus: 23105.
Количество записей в банке Swissprot, описывающих белки из отдела Firmicutes: 68204.