ПОИСК В SRS

Назад

Благодаря SRS@EMBL-EBI можно проводить поиск данных по нескольким критериям в различных базах. Здесь я опишу процесс работы с поиском.

Для проведения поиска белка сначала необходимо выбрать базу данных, по которой он будет осуществляться. Для этого нужно через меню перейти на страницу «Library page» и выбрать из списка нужную БД. Я выбрал UniProtKB/SwissProt.


На странице «Query form» выберем тип информации, по которой будет идти отбор данных, и слово, которое должно встречаться в результатах. Для поиска нужно нажать «Search».


Результаты поиска по установке выводятся в виде таблицы. Внизу предыдущей страницы можно выбрать отображаемые поля таблицы. При нажатии на “Accession” выводится текст записи в выбранной БД. Для более удобного представления информации о белке перейдём по ссылке в первом поле.


На открывшейся странице вверху есть меню перемещения между разделами информации о белке.


В разделе «Features» есть диаграмма, представляющая вторичную структуру белка. Эта диаграмма расширенная, для получения расширенной диаграммы нужно нажать ссылку в красном овале. Цветные плашки, обозначающие элементы структуры, кликабельны и переводят на страницы с подробной информацией об их устройстве.


Вот некоторые описания структур белка YokD_BacSu:

ID YOKD_BACSU_6; parent: YOKD_BACSU
FT STRAND 31 36
SQ Sequence 6 AA;
TVLVHS
//Бета-тяж, состоящий из 6 аминокислотных остатков с 31 по 36.

ID YOKD_BACSU_2; parent: YOKD_BACSU
FT REGION 38 44 Coenzyme A binding.
SQ Sequence 7 AA;
LSSIGWV
//место связывания лиганда, 7 аминок-ных остатков

ID YOKD_BACSU_32; parent: YOKD_BACSU
FT HELIX 251 267
SQ Sequence 17 AA;
LTEAVDFAEK WFINNDS
//альфа-спираль из 17 аминок-ных остатков с 251 по 267

Для получения ссылок на страницы результатов поиска в других БД на странице с таблицей выберите интересующие вас позиции и слева нажмите кнопку в красном овале на рисунке ниже.


Вы увидите страницу, на которой вам надо будет выбрать интересующие базы данных галочкой и нажать «Search».

Если же вам надо сохранить результаты своего поиска, то в поле «Result Options» нажмите на кнопку «Save», предварительно отметив подходящие позиции, иначе сохранятся они все.


В открывшейся странице выберите, в каком виде вы хотите сохранить результаты. Если вы сохраняете текст на свой компьютер, то после загрузки не забудьте переименовать и отредактировать файл и добавить подходящее расширение, если оно вам нужно, например «.txt».


Мои действия вылились в следующий абзац:

PDB:2NYG
CRYSTAL STRUCTURE OF YOKD PROTEIN FROM BACILLUS SUBTILIS
MOL_ID: 1;
MOLECULE: YOKD PROTEIN;
CHAIN: A, B, C, D, E, F;
ENGINEERED: YES
MOL_ID: 1;
ORGANISM_SCIENTIFIC: BACILLUS SUBTILIS;
ORGANISM_TAXID: 1423;
GENE: YOKD;
EXPRESSION_SYSTEM: ESCHERICHIA COLI;
EXPRESSION_SYSTEM_TAXID: 562;
EXPRESSION_SYSTEM_STRAIN: BL21(DE3)-CODON+RIL;
EXPRESSION_SYSTEM_VECTOR_TYPE: PLASMID;
EXPRESSION_SYSTEM_PLASMID: PSGX4(BS)
PFAM02522, NYSGXRC, 10116C, AMINOGLYCOSIDE 3-N-ACETYLTRANSFERASE, PSI-2, STRUCTURAL GENOMICS, PROTEIN STRUCTURE INITIATIVE,
NEW YORK SGX RESEARCH CENTER FOR STRUCTURAL GENOMICS, UNKNOWN FUNCTION
M.MADEGOWDA,S.ESWARAMOORTHY,S.K.BURLEY,S.SWAMINATHAN,NEW YORK SGX RESEARCH CENTER FOR STRUCTURAL GENOMICS (NYSGXRC)

Cоставление запросов

При составлении запросов на странице "Query form" настоятельно рекомендуется применять маски файлов, операторы "!" и "&". На странице "Results" можно ввести готовую форму запроса.
Примеры составления запросов:

((([swissprot-Description:*acetyltransferase*] & [swissprot-Description:*aminoglycoside*]) & ([swissprot-Species:*] ! [swissprot-Species:*ubtillus*])) & [swissprot-Taxonomy:*firmicutes*])

Этот запрос выдаёт 8 результатов. Полноценный поиск по функции нельзя провести, поскольку у исходного белка она неизвестна.

Cледующий запрос выводит 9 результатов (8 из предыдущего плюс 1 исходный белок):

(([swissprot-Description:*acetyltransferase*] & [swissprot-Description:*aminoglycoside*]) & [swissprot-Taxonomy:*firmicutes*])

(([swissprot-Description:*n-acetyltransferase*] ! [swissprot-Description:fragment*]) & ([swissprot-Taxonomy:*firmicutes*] ! [swissprot-Taxonomy:*acillus*]))

Вышеприведённый запрос не требует от белков прямого доказательства их существования, поэтому он выводит гораздо больше результатов – 213.

Формулировка функции белкаСтрока запросаКоличество найденных документов
*acetyltransferase* & *aminoglycoside*((([swissprot-Description:*acetyltransferase*] & [swissprot-Description:*aminoglycoside*]) & ([swissprot-Species:*] ! [swissprot-Species:*ubtillus*]))& [swissprot-Taxonomy:*firmicutes*])8
-//-(([swissprot-Description:*acetyltransferase*] & [swissprot-Description:*aminoglycoside*]) & [swissprot-Taxonomy:*firmicutes*])9
-//-(([swissprot-Description:*n-acetyltransferase*] ! [swissprot-Description:fragment*]) & ([swissprot-Taxonomy:*firmicutes*] ! [swissprot-Taxonomy:*acillus*]))213
Задания 4, 5:
По следующим ссылкам расположены файлы с сохранёнными секвенсами 9 белков и более полной информацией о них, соответственно.
seqs9 extend9

Однако эти белки и схожи по функции с Yokd_BACSU, они не принадлежат видам одного рода, а значит, имеют значительные отличия, как по количеству нуклеотидов, так и по их идентичности набора нуклеотидв. Таким образом, эволюционно далёкие, хотя и выполняющие одну функцию, белки могут значительно различаться по первичнй структуре.
Следующий вопрос выводит белки Yokd из рода Subtillus и других близкородственных. Именно эти белки я буду в будущем использвать при выполнении заданий, поскольку они наиболее схожи с моим исходным белком:
[libs={uniprot swissprot}-GeneName:yokd*]
Вот ссылка на последовательности 7 из 19 полученных результатов: seqs7-yokd

© Галкин Федор