Информация из UniProt | ||
---|---|---|
Позиция | Значение | Комментарий |
Название |
Полное: Bacteriorhodopsin Краткое:BR |
Есть альтернативные названия: Полное: Bacterioopsin Краткое: BO |
UniProt ID | BACR_HALSA | Запись сделана в Swiss-Prot |
UniProt AC | P02945 | Также есть ещё один AC: Q9HPU5 |
EMBL AC нуклеотидной записи | V00474 | Также есть ещё 3 AC: M11720, X70293, AE004437 |
PDB ID | 6G7H | Также там ещё множество (155) записей в PDB. Все они доступны по ссылке. Также там рядом с ID указаны способы получения структуры белка |
Длина, а. о. | 262 | - |
Молекулярная масса, Дальтон | 28256 | - |
Бактериородопсин является трансмембранным семиспиральным белком, выполняющим функцию переноса протонов с одной стороны мембраны на другую. Для него известна структура всей полипептидной цепи (она одна) и полная 3D-структура в банке PDB.
Общая информация о кластерах | |||
---|---|---|---|
Название кластера | ID кластера | Размер кластера, записи | Организмы |
Bacteriorhodopsin | UniRef100_P02945 | 4 | Halobacterium salinarum (100%) |
Bacteriorhodopsin | UniRef90_P02945 | 60 | Halobacterium salinarum (100%) |
Bacteriorhodopsin | UniRef50_P02945 | 76 |
|
Как мы можем заметить, абсолютное большинство последовательностей из кластеров были обнаружены в бактерии вида Halobacterium salinarum (в огромном множестве разных её штаммов). Это говорит о том, что бактериородопсин может быть очень не распространённым белком, раз встречается в большинстве случаев в одном виде бактерии.
Также заметим, что при переходе от UniRef100 к UniRef90 количество записей в кластерах сильно увеличивается, с 4 до 60, но организм, в котором этот белок встречается, при этом не меняется. Это только укрепляет предположение о том, что бактериородопсин нельзя назвать распространённым белком. Ведь даже при отклонении идентичности первичной структуры белка на 10%, его организменное местоположение никак не поменялось.
По таблице мы видим, что при переходе от UniRef90 к UniRef50 количество записей увеличивается не так сильно, как при переходе с UniRef100 к UniRef90. Это может нам сказать о повышенной консервативноссти белка. Близких бактериородопсину по струкутре белков гораздо больше, чем далёких.
Результаты сеансов поиска UniProt | ||||
---|---|---|---|---|
Область поиска | Запрос в строке поиска | Всего нашлось в Swiss-Prot | Всего нашлось | Комментарий |
По рекомендованному названию | name:bacteriorhodopsin | 15 | 916 | - |
По рекомендованному названию среди белков организма | name:bacteriorhodopsin organism:"halobacterium salinarum strain atcc 700922 jcm 11081 nrc-1" | 3 | 5 | Только 2 из 5 полученных результата являются непосредственно бактериородопсинами |
По рекомендованному названию среди белков организмов того же семейства (Halobacteriaceae) | name:bacteriorhodopsin taxonomy:halobacteriaceae | 8 | 83 | Большинство результатов относятся к uncultured haloarchaeon и Halobacterium salinarum (80-90%) |
По рекомендованному названию среди белков организмов того же типа (Euryarchaeota) | name:bacteriorhodopsin taxonomy:euryarchaeota | 15 | 493 | Тут уже абсолютное большинство белков-бактериородопсинов и на них похожих, а также около 20% белков принадлежат uncultured Halobacteriales archaeon |
По актину | name:actin | 1199 | 99482 | Очевидно, что без ограничения поиска по организмам количество записей будет огромным |
По актину среди белков членистоногих | name:actin taxonomy:arthropoda | 63 | 7379 | Количество записей заметно уменьшилось, что логично, т. к. мы сильно сузили круг поиска. Очевидно, что актин имеется в организмах типа Членистоногие |
По актину среди белков настоящих грибов | name:actin taxonomy:fungi | 215 | 38017 | Для меня оказалось удивительным то, что если отсеивать записи, относящиеся к актину, по настоящим грибам (Fungi), то мы в итоге получаем больше записей, нежели в прошлом результате по Arthropoda |
По трипсину | name:trypsin | 320 | 29929 | - |
По трипсину, исключая ингибиторы трипсина | name:trypsin NOT name:inhibitor | 104 | 24960 | - |
История записи P02945 будет доступна вам по ссылке.
Из интересных фактов:
В строках FT нестандартные а. о. обозначаются ключевым словом NON_STD. Показывает наличие в первичной структуре белка селеноцистеина (Sec, U) и пирролизина (Pyl, O). Пример:
FT NON_STD 356 FT /note="Pyrrolysine" FT /evidence="ECO:0000250"
Они обозначаются ключевым словом MOD_RES. Показывают наличие каких-либо посттрансляционных модификаций аминокислотных остатков (в том числе фосфорилирование). Пример:
FT MOD_RES 206 FT /note="Phosphoserine; by CK1" FT /evidence="ECO:0000269|PubMed:8999878"
Присоединение сахаров обозначается отдельным ключевым словом в FT - CARBOHYD. Показывает присоединение какого-либо сахара к а. о. белка. Если в названии сахара присутствует заключающее троеточие, то это значит, что после названных сахаров цепь продолжается; если троеточия нет, то значит, что присоединён моносахарид. Пример:
FT CARBOHYD 53 FT /note="N-linked (GlcNAc...) asparagine" FT /evidence="ECO:0000269|PubMed:19159218"
Наличие дисульфидной связи кодируется в строках FT ключом DISULFID. Через троеточие показывает 2 а. о., которые соединены S-S связью. Если написан лишь 1 номер а. о., значит связь межцепочечная. Например:
FT DISULFID 23..84 FT /evidence="ECO:0000305"
Под ключом VAR_SEQ в строках FT пишут про возможные варианты последовательности, связанные с альтернативным сплайсингом, использованием альтернативных (допольнительных) промоторов, альтернативным началом считывания или рибосомального фреймшифтинга. Пример:
FT VAR_SEQ 653..672 FT /note="VATSNPGKCLSFTNSTFTFT -> ALVSHHCPVEAVRAVHPTRL (in isoform 2)" FT /evidence="ECO:0000303|PubMed:12034717, ECO:0000303|PubMed:12435728" FT /id="VSP_003786"
Случаи, когда выясняется, что 2 следующих друг за другом а. о. на самом деле стоят НЕ друг за другом, а между ними находится нерасшифрованный участок последовательности, кодируются ключом NON_CONS. Пример:
FT NON_CONS 52..53 FT /evidence="ECO:0000305"
Если для белка известна вторичная структура, то в Feature Table участки вторичной структуры помечают отдельными ключевыми словами:
Пример:
FT HELIX 3..12 FT /evidence="ECO:0000244|PDB:1HB6"
Источник полученной информации доступен по ссылке.