Учебный сайт Кирилла Цуканова → Первый семестр

Получение информации о белке из файла с геномом и работа с научными базами данных

Модель белка yvdD по данным рентгеноструктурного анализа

В наличии имелся очень большой файл с секвенированным и описанным геномом сенной палочки (Bacillus subtilis), штамм 168. Каждому был выдан ген, например, мне достался yvdD.

На момент сборки файла белок, кодируемый этим геном, еще не был обнаружен и числился как гипотетический. Было известно только, что ген гомологичен каким-то другим ранее известным генам, правда, тоже с неизвестной функцией. Технические координаты этого белка в различных научных базах таковы:

UniProt/SwissProt AC	O06986
UniProt/SwissProt ID	YVDD_BACSU
PDB ID			1T35

За дальнейшей информацией отправляемся в интернет. Во-первых, по данным UniProt, белок уже подтвержден. «Protein existence: Evidence at protein level» означает, что «есть надежные экспериментальные данные в пользу существования белка, такие как полное или частичное прямое секвенирование по методу Эдмана, четкое совпадение по данным масс-спектрометрии или рентгеноструктурного анализа». Там же узнаем, что рекомендуемое название белка — «LOG family protein yvdD», или, по-русски, «белок yvdD из семейства LOG».

На сайте EBI можно найти информацию об этом семействе белков: его полное название — «Cytokinin riboside 5'-monophosphate phosphoribohydrolase LOG», а белки этого семейства относятся к классу фосфорибогидролаз и катализируют превращение нуклеотидов цитокининов в биологически активную форму.

Функция именно этого белка еще точно не определена. В базе PDB белок называется «putative lysine decarboxylase», то есть «предполагаемая лизин-декарбоксилаза», со ссылкой на единственную написанную о нем статью (еще не опубликованную).

Первичная последовательность белка состоит из 191 аминокислоты и выглядит так:

MKTICVFAGS NPGGNEAYKR KAAELGVYMA EQGIGLVYGG SRVGLMGTIA DAIMENGGTA IGVMPSGLFS GEVVHQNLTE LIEVNGMHER KAKMSELADG
FISMPGGFGT YEELFEVLCW AQIGIHQKPI GLYNVNGYFE PMMKMVKYSI QEGFSNESHL KLIHSSSRPD ELIEQMQNYS YPILEKKWTE I

(Особенно интересующиеся могут скачать файл с последовательностью этого белка в формате fasta.)

В базе PDBe на сайте EBI можно найти потрясающе красивые модели этого белка, одна из которых украшает верх этой страницы. В описании указано, что белок образует октомеры с одинаковыми частями (поэтому он такой большой). Макромолекула белка также содержит в своем составе 14 сульфат-ионов и 96 молекул селенометионина.

Источники информации