1. Особенности белка GLOX_BACSU.

 

Особенности Описание
ID GLOX_BACSU_16; parent: GLOX_BACSU
FT HELIX 14 25
SQ Sequence 12 AA;
IIGSAIAYYL AK
Представленная особенность является α-спиралью,которая начинается с 14 аминокислотного остатка и заканчивается 25 аминокислотным остатком.
Продолжительность α-спирали 12 ао: изолейцин, изолейцин, глицин, серин, аланин, изолейцин, аланин, тирозин, тирозин, лейцин, аланин, лизин.
ID GLOX_BACSU_35; parent: GLOX_BACSU
FT STRAND 191 200
SQ Sequence 10 AA;
GDVWANHVVV
Представленная особенность является β-тяжем,который начинается с 191 аминокислотного остатка и заканчивается 200 аминокислотным остатком.
Продолжительность β-тяжа 10 ао: глицин, аспарагиновая кислота, валин, триптофан, аланин, глутаминовая кислота, гистидин, валин, валин, валин.
ID GLOX_BACSU_27; parent: GLOX_BACSU
FT TURN 110 113
SQ Sequence 4 AA;
QMDD
Представленная особенность является поворот,который начинается с 110 аминокислотного остатка и заканчивается 113 аминокислотным остатком.
Продолжительность поворота 4 ао: глутамин, метионин, аспарагиновая кислота, аспарагиновая кислота.

2. Описание всех записей банка трехмерных структур PDB, относящихся к белку GLOX_BACSU.

На странице находок обращаю внимание на окошко Apply options to слева. В нем указано к каким находкам буду применяться последующие действия: selected results only или unselected results only. Так как при поиске мне выдан только один результат: UniProtKB/Swiss-Prot:HUTP_BACSU - нет необходимости ставить галочку, а можно оставить unselected results only. Перехожу по ссылке Link to related information, которая находится слева чуть ниже окошка Apply options to. Выбираю банк PDB. Его можно найти в Protein function, structure and interaction databases/Protein structure databases. Жму Search, получаю список, сохраняю информацию по ссылке Save. Перед сохранением указываю сохранение в текстовом формате: Output To: File (text). Проверяю, что число Number of entries to download (по умолчанию у меня - 30) больше числа сохраняемых записей, Save with view установлено на PDBShortView (а можно было бы выбрать Complete entries, или fasta sequences, или др.).
Сохраняем файл glox_bacsu_pdb.txt.

 

Формулировка функции белка Строка запроса Количество найденных документов
oxidase ([swissprot-Taxonomy:Firmicutes*] & [swissprot-Description:oxidase*]) 308
Glycine oxidase ([uniprot-Taxonomy:firmicutes*] & ([uniprot-Description:glycine oxidase*] ! [uniprot-Description:fragment*])) 191
xidase ([uniprot-Taxonomy:firmicutes*] & ([uniprot-Description:oxidase*] & [uniprot-Description:fragment*])) 172
Glycine oxidase (([uniprot-Taxonomy:firmicutes*] & [uniprot-Description:glycine*]) & [uniprot-Description:oxidase*]) 294

В связи с тем, что на некоторые запросы нашлось либо очень мало результатов, либо вообще ноль, некоторые запросы я искала в БД Uniprot, для повышения числа находок.

4. Полноразмерные последовательности найденных белков в fasta формате.


Так как похожих по функции белков много, я решила взять те, которые из Bacillus subtilis.
(запрос: ((([uniprot-Description:glycine oxidase*] ! [uniprot-Description:fragment*]) & [uniprot-Organism:Firmicutes*]) & ([uniprot-Organism:Bacillus*] & [uniprot-Organism:subtilis*])))
. В итоге было полученно 6 находок и сохранено в файле 2prak.fasta

5.Сохранения списка последовательностей из задания 4 , в котором указаны ID, AС последовательностей , организм (Species), название белка (Description) и длина последовательностей.

В разделе Create a view выбираем поля: ID, Accession Number, Description, Species, Sequence Length. Отметим те же последовательности, что и в 4 задании. Получим файл similar_glox_bacsu.xls