Банк данных UniProt


UniProt является комплексным, высококачественным и свободно доступным банком данных о последовательностях белков.
Он содержит большое количество информации о биологической структуре, функциях и особенностях множества белков, полученное из научных публикаций.


№1. Пользуясь банком данных UniProt можно получить следующую информацию о белке ACP_BACSU:
---------------------------------------------------------------------------------------------------------------------------------
Оформим это и последующие задания в виде таблиц.

метка поля содержание
Код(ы) доступа ("Accession number") AC P80643; P51832;
Идентификатор записи в БД ID ACP_BACSU
Название (краткое описание) белка DE Full=Acyl carrier protein; Short=ACP; (больше информации не дано)
Дата создания документа DT 01-OCT-1996, integrated into UniProtKB/Swiss-Prot.
Дата последнего исправления аннотации DT 25-JAN-2012, entry version 97.
Число публикаций, использованных при создании документа RN [6]
Журнал и год самой поздней публикации RL журнал "Structure",2001.
Ключевые слова KW 3D-structure; Complete proteome; Cytoplasm; Direct protein sequencing; Fatty acid biosynthesis; Lipid synthesis; Phosphopantetheine; Reference proteome.
Что содержит поле комментариев? СС FUNCTION; PATHWAY; SUBCELLULAR LOCATION; PTM; SIMILARITY; Copyrighted by the UniProt Consortium...*
Идентификаторы записей PDB DR 1F80; 1HY8; 2X2B;

*Полное содержание поля комментариев:

FUNCTION: Carrier of the growing fatty acid chain in fatty acid biosynthesis.
PATHWAY: Lipid metabolism; fatty acid biosynthesis.
SUBCELLULAR LOCATION: Cytoplasm (By similarity).
PTM: 4'-phosphopantetheine is transferred from CoA to a specific
serine of apo-ACP by AcpS. This modification is essential for
activity because fatty acids are bound in thioester linkage to the
sulfhydryl of the prosthetic group.
SIMILARITY: Contains 1 acyl carrier domain.
Copyrighted by the UniProt Consortium, see http://www.uniprot.org/terms
Distributed under the Creative Commons Attribution-NoDerivs License.





№2. Ответы на вопросы о белке ACP_BACSU
-----------------------------------------------------------

вопрос ответ
1.
В какой части бактериальной клетки локализован Ваш белок? На какой участок вашего белка
Вы бы стали воздействовать,чтобы помешать его правильной локализации в клетке?
SUBCELLULAR LOCATION: Cytoplasm (By similarity).
SIMILARITY: Contains 1 acyl carrier domain.
То есть, белок растворен в цитоплазме бактериальной клетки, из чего следует, что он гидрофилен.
Это означает, что пришив крупный гидрофобный остаток (как, например, в молекуле хлорофилла), можно добиться внедрения белка в мембрану.
2.
Последовательности большинства белков начинаются с метионина. Почему?
Метионин - аминокислота, кодируемая единственным старт-кодоном (АУГ).
После биосинтеза в процессе созревания белка метионин может быть удален. Указан ли метионин в начальной позиции заданного белка? Да, метионин присутствует:
SEQUENCE 77 AA; 8591 MW; 75E745DE3C6A0951 CRC64;
MADTLERVTK IIVDRLGVDE ADVKLEASFK EDLGADSLDV VELVMELEDE FDMEISDEDA
EKIATVGDAV NYIQNQQ
А удаляется ли он потом? Да, об этом говорят данные, RasMol. В белке присутствует только 9 остатков метионина, и все они находятся в середине своих цепей.
3.
Какой функции этого белка посвящена одна из статей, упомянутых в записи? из банка данных следует:
FUNCTION: Carrier of the growing fatty acid chain in fatty acid biosynthesis.
PATHWAY: Lipid metabolism; fatty acid biosynthesis.
То есть, данный белок участвует в биосинтезе жирных кислот.
Одна из перечисленных статей вышла под названием:"Role of the D-alanyl carrier protein in the biosynthesis of D-alanyllipoteichoic acid." (J. Bacteriol.1994).
Откуда следует, что данная статья исследовала роль белка в биосинтезе конкретной жирной кислоты.





№3. Поиск белков с кодом ACP или со сходным описанием.
---------------------------------------------------------------------------

Используем команду infoseq для поиска в SwissProt.
Выполним следующую команду:

infoseq sw:acp_* -only -description -noheading | wc --line

Команда посылает запрос на выдачу описаний белков, убирая при этом заголовки.
С помощью конвейера | мы передаем получаемую информацию команде wc для подсчёта количества строк (--line).
Лично убедиться, что на конвейер передается только нужная информация можно, отправив запрос без подсчета числа строк.
В результате получим число 521. То есть, количество записей в SwissProt с кодом белка ACP равно 521.

На сайте UniProt с помощью поискового запроса можно посмотреть количество записей со сходным описанием в SwissProt и TrEMBLE:
К сожалению, мой белок не имеет второго названия, поэтому пришлось поиграть с кратким и полным названиями и ключевыми словами.
Вот некоторые результаты.
Причем, запрос вида name:"ACP" осуществляет поиск записи по названию,
использование слов AND и OR стандартно для всех запросов, а запрос вида name:"Acyl carrier protein" and Bacillus
найдет записи со словом Bacillus (в белке, роде или систематике) и "Acyl carrier protein" в названии.

команда/запрос Число записей в SwissProt Число записей в TrEMBL
infoseq sw:acp_* -only -description -noheading | wc --line 521 -
name:"Acyl carrier protein" 4,238 48,709
name:"Acyl carrier protein" and "ACP" 3,920 34,787
name:"ACP" 3,124 15,999
name:"Acyl carrier protein" and Bacillus 130 2,071





№4*(доп). Сравнение записей о белке ACP_ECOLI и информации о ACP_BACSU
------------------------------------------------------------------------------------------------------

ACP_ECOLI ACP_BACSU
Первый код доступа P0A6A8; P02901; Q53352; P80643; P51832;
Идентификатор последовательности в БД ACP_ECOLI ACP_BACSU
Название (краткое описание) белка Full=Acyl carrier proteiin; Short=ACP; Full=Acyl carrier protein; Short=ACP;
Дата создания документа 21-JUL-1986 01-OCT-1996
Дата последнего исправления аннотации 25-JAN-2012, entry version 73. 25-JAN-2012, entry version 97.
Название организма Escherichia coli (strain K12) Bacillus subtilis
Классификация организма (список таксонов) Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Bacteria; Firmicutes; Bacillales; Bacillaceae; Bacillus
Длина последовательности 78 77
Молекулярная масса белка 8640 8591
Число публикаций, использованных при создании документа [14] [6]
Журнал и год самой поздней публикации журнал "Structure",1990. журнал "Structure",2001.
Ключевые слова 3D-structure; Complete proteome; Cytoplasm; Direct protein sequencing; Fatty acid biosynthesis; Lipid synthesis; Phosphopantetheine; Reference proteome. 3D-structure; Complete proteome; Cytoplasm; Direct protein sequencing; Fatty acid biosynthesis; Lipid synthesis; Phosphopantetheine; Reference proteome.
Темы, освещённые в комментариях FUNCTION; PATHWAY; SUBCELLULAR LOCATION; PTM; SIMILARITY; Copyrighted by the UniProt Consortium... (см. выше)
Особенности последовательности INIT_MET 1 1 Removed.
CHAIN 2 78 Acyl carrier protein.
/FTId=PRO_0000180134.
MOD_RES 37 37 O-(pantetheine 4'-phosphoryl)serine.
MUTAGEN 37 37 S->A,T: Loss of phosphopantetheinylation,
and inhibition of cell growth.
CONFLICT 25 25 N -> D (in Ref. 6; AA sequence).
CONFLICT 44 44 V -> I (in Ref. 7; AA sequence).
CONFLICT 71 71 D -> V (in Ref. 2; AAB27925).
CONFLICT 76 76 H -> N (in Ref. 2; AAB27925).
HELIX 4 16
HELIX 20 22
TURN 29 32
HELIX 37 51
HELIX 57 60
HELIX 66 75
CHAIN 1 77 Acyl carrier protein.
/FTId=PRO_0000180104.
MOD_RES 37 37 O-(pantetheine 4'-phosphoryl)serine.
HELIX 3 14
TURN 15 21
STRAND 25 27
STRAND 29 33
HELIX 37 50
HELIX 57 62
HELIX 66 76
Идентификаторы записей PDB 1ACP; 1L0H; 1L0I; 1T8K; 2FAC; 2FAD; 2FAE; 2FHS; 2K92; 2K93; 2K94; 3EJB; 3EJD; 3EJE; 1F80; 1HY8; 2X2B;

В итоге можно сделать вывод, что белок ACP_ECOLI был изучен более подробно, чем мой первый белок.
О нем написан больше статей, сделано больше аннотаций.
В то же время, белок ACP_BACSU оказался труднее в исследовании, данные о нем свежее, исправлений больше, изучен он тоже довольно хорошо.



назад в проекты.html


© Aleshin Vasily