Информация из баз данных Uniprot и Refseq Protein o белке пептидогликан гликозилтрансферазе

Таблица 1. Информация о пептидогликан гликозилтрансферазе
Uniprot ID C8W8H7_ATOPD
Uniprot AC C8W8H7
RefSeq ID WP_012809424.1 (YP_003180359.1 устаревший)
PDB ID 4RA7; 4JBF; 4N1X; 4QJG; 4R0Q; 4R1G; 4R23; 4R3J
Длина 954 аминокислотных остатка
Молекулярная масса 100455 Да (1 Дальтон = 1 а.е.м.)
Рекомендуемое Unirpot название Peptidoglycan glycosyltransferase

Комментарий к таблице 1. Из файла C8W8H7.txt можно узнать, что данные не рецензировались; кодируемый белок является ферментом с классификационным номером 2.4.1.129; ген, кодирующий этот белок располагается в локусе Apar_1344; структура известна для всего белка, в записях PDB она представлена двумя цепями.
Классификация организма по Uniprot: Bacteria => Actinobacteria => Coriobacteriia => Coriobacteriales => Atopobiaceae => Atopobium => Atopobium parvulum.

Кластеры Uniref для пептидогликан гликозилтрансферазы

Для данного белка существуют все три кластера: UniRef100, UniRef90, UniRef50. В одну запись UniRef100 попадают идентичные последовательности и суб-фрагменты с 11 и более аминокислотными остатками из различных организмов. В одну запись UniRef90 относят последовательности, идентичные по крайней мере на 90% и на 80% совпадающие с самой длинной последовательностью. А в одну запись UniRef50 попадают последовательности, идентичные друг другу на 50% и более, а также хотя бы на 80% совпадающие с самой длинной последовательностью.

Таблица 2. Информация о кластерах Uniref для пептидогликан гликозилтрансферазы
Название кластера Элементы кластера (Uniprot AC) Количество белков в кластере
UniRef100 C8W8H7 1
UniRef90 C8W8H7, Z4X3B3, Z4WU45, UPI00050E572D 4
UniRef50 C8W8H7, Z4X3B3, Z4WU45, UPI00050E572D, UPI00073FA1E6, UPI00050960FC, F1T5U6, UPI00065E45F1, A0A0K1F1T8, G1WIH7, S2ZQR2, A0A0R2LKD8, B9CLP2, U2VD34, U1WUI3, UPI0005551D59, U2V1V6, UPI000423FFCF, E1L139, UPI00058C5F48, R7D3G8, A4E9Z1, A0A096KKF2, UPI00071C9B0E, E1QXJ2, 25

Комментарий к таблице 2. В кластере Uniref90 присутствуют два пенициллин-связывающих белка, домена транспептидазы белка из других представителей рода Atopobium. А в Uniref50 обнаруживаются пептидогликан гликозилтрансферазы из родственных организмов Olsenella sp. и Collinsella sp.

Результаты сеансов поиска в Uniprot

1) Поиск по рекомендованному названию белка. Текст запроса:"name:peptidoglycan name:glycosyltransferase". Нашлось 3323 белка, из которых 33 из раздела Reviewed (Swiss-Prot).
2) Поиск по тому же названию среди белков из организмов того же семейства (family). Текст запроса:"name:peptidoglycan name:glycosyltransferase taxonomy:atopobiaceae". Нашлось 10 белков, из которых 0 из раздела Reviewed (Swiss-Prot).
3) Поиск по тому же названию среди белков из организмов того же отдела (phylum). Текст запроса:"name:peptidoglycan name:glycosyltransferase taxonomy:"Actinobacteria [201174]"". Нашлось 470 белков, из которых 0 из раздела Reviewed (Swiss-Prot).
4.1) Поиск по названию hemoglobin. Текст запроса:"name:hemoglobin". Нашлось 8374 белка, из которых 944 из раздела Reviewed (Swiss-Prot).
4.2) Поиск по названию hemoglobin среди позвоночных (Vertebrata). Текст запроса:"name:hemoglobin taxonomy:"Vertebrata [7742]"". Нашлось 2442 белка, из которых 821 из раздела Reviewed (Swiss-Prot).
4.3) Поиск по названию hemoglobin среди членистоногих (Arthropoda). Текст запроса:"name:hemoglobin taxonomy:"Arthropoda [6656]"". Нашлось 745 белков, из которых 0 из раздела Reviewed (Swiss-Prot).
5.1) Поиск по названию trypsin. Текст запроса:"name:trypsin". Нашлось 11159 белков, из которых 301 из раздела Reviewed (Swiss-Prot).
5.2) Поиск по названию trypsin среди его ингибиторов. Текст запроса:"name:trypsin name:inhibitor". Нашлось 2558 белков, из которых 203 из раздела Reviewed (Swiss-Prot).