Базы последовательностей белков

На этой странице представлена информация о базах последовательностей белков. Изученный белок - D-аланил-D-аланин карбоксипептидаза (D-alanyl-D-alanine carboxypeptidase) из бактерии Nostoc sp., штамм PCC 7524 (ATCC 29411). Этот белок является сериновой протеазой и относится к семейству PBP4. Информацию о гене этого белка и о бактерии можно найти на страницах первого семестра.

Идентификаторы данного белка в различных базах данных представлены в таблице 1. Также в таблице даны ссылки на записи о белке в соответствущих базах данных. Запись YP_007078865.1 в базе RefSeq Proteins была удалена и заменена на новую (с идентификатором WP_015141669.1). У этого белка нет идентификатора в PDB, однако имеется запись о гомологе белка из бактерии Actinomadura sp. (идентификатор 3ZCZ), с которым я работала в первом блоке, посвященном программе Jmol.

Таблица 1. Идентификаторы белка D-аланил-D-аланин карбоксипептидазы из бактерии Nostoc sp., штамм PCC 7524 в различных базах данных.
База данных Идентификатор
Uniprot AC: K9R0L9
ID: K9R0L9_NOSS7
Uniref50 UniRef50_K7WEQ6
RefSeq Proteins YP_007078865.1 и WP_015141669.1

В базе данных Uniprot первая запись о белке появилась 6 марта 2013 года. Сейчас представлена 11 версия записи, последнее изменение совершено 7 января 2015 года. Изменений в аминокислотной последовательности белка за это время не было, в основном они касались описания белка.
Содержательные изменения показаны на рисунках 1 и 2. За время существования записи было добавлено 16 ссылок на другие базы данных (о самом белке и о его гене). Также появились новые ключевые слова (Hydrolase, Protease, Reference proteome). Во многих строках добавлены ссылки на источник в виде "{ECO:0000313|EMBL:AFY51268.1}", то есть запись о белке создана автоматически, а информация получена из базы данных ENA.

Добавлены ссылки на базы данных

Рисунок 1. Пример добавления ссылок на другие базы данных

Добавлены ключевые слова

Рисунок 2. Добавлены новые ключевые слова и ссылки на источники. При этом сначала была удалена исходная информация (выделена желтым и отмечена знаком "-"), а потом добавлена новая (выделена зеленым, знак "+")

В кластере изучаемого белка в базе данных Uniref50 находится 47 белков. Все эти белки выделены из бактерий, входящих в отдел Цианобактерии (Cyanobacteria), как и Nostoc sp. Для сравнения белка с гомологичными белками были выбраны 3 записи из кластера (бактерии Gloeocapsa sp., штамм PCC 7428, Microcoleus vaginatus, штамм FGP-2 и Crinalium epipsammum, штамм PCC 9333), а также гомолог из бактерии Actinomadura sp., штамм R39. Таблицу сравнения можно посмотреть в формате excel.
Наиболее изученным белком из исследованных гомологов является белок P39045 из актинобактерии Actinomadura sp.. В записи Uniprot указана его функция (удаление с С-конца остатка аланина в углеводах - предшественниках веществ клеточной стенки), информация о каталитической активности, об активных центрах, об элементах вторичной структуры, о веществах, ингибирующих действие этого белка (например, бензилпенициллин). Также для этого белка есть более 15 записей в PDB.
У всех изученных белков есть 1 сигнальная последовательность (необходима для котрансляционной секреции белка), расположенная в начале аминокислотной последовательности (примерно первые 30 остатков). Однако остальные белки только предсказаны (predicted protein), поэтому информации об их функциях нет. Единственным признаком, по которому можно сравнить эти белки, является длина последовательности. Изучаемый белок из бактерии Nostoc sp., штамм PCС 7524 (идентификатор K9R0L9) имеет среднюю длину - 487 а.о. Самый длинный из белков - P39045, длина 538 а.о. Самый короткий - K9XI43 из бактерии Gloeocapsa sp., штамм PCC 7428, длина 477 а.о.

Специфические особенности белков представлены в записи Uniprot в поле Feature Table (FT). На примере белка монометиламин метилфтрансферазы (Monomethylamine methyltransferase MtmB1) из археи Methanosarcina barkeri показано два явления: наличие нестандартной аминокислоты пирролизина (Pyl) и удаление инициаторного метионина. Идентификатор записи белка в Uniprot: MTMB1_METBA (AC: O30642).

		FT   INIT_MET      1      1       Removed. {ECO:0000269|PubMed:11435424}.
		FT   NON_STD     202    202       Pyrrolysine.
						

© Наталия Кашко, 2015