Учебный сайт Левина Ильи, 2-й семестр

Описание бактериородопсина по базе данных UniProt

Описание белка по базе UniProt

Информация из UniProt
Позиция Значение Комментарий
Название

Полное: Bacteriorhodopsin

Краткое:BR

Есть альтернативные названия:

Полное: Bacterioopsin

Краткое: BO

UniProt ID BACR_HALSA Запись сделана в Swiss-Prot
UniProt AC P02945 Также есть ещё один AC: Q9HPU5
EMBL AC нуклеотидной записи V00474 Также есть ещё 3 AC: M11720, X70293, AE004437
PDB ID 6G7H Также там ещё множество (155) записей в PDB. Все они доступны по ссылке. Также там рядом с ID указаны способы получения структуры белка
Длина, а. о. 262 -
Молекулярная масса, Дальтон 28256 -

Бактериородопсин является трансмембранным семиспиральным белком, выполняющим функцию переноса протонов с одной стороны мембраны на другую. Для него известна структура всей полипептидной цепи (она одна) и полная 3D-структура в банке PDB.

Описание кластеров UniRef бактериородопсина

Общая информация о кластерах
Название кластера ID кластера Размер кластера, записи Организмы
Bacteriorhodopsin UniRef100_P02945 4 Halobacterium salinarum (100%)
Bacteriorhodopsin UniRef90_P02945 60 Halobacterium salinarum (100%)
Bacteriorhodopsin UniRef50_P02945 76
  • Halobacterium salinarum (74%)
  • Halobacteriales archaeon (5%)
  • Salinigranum sp. (4%)
  • Haloarchaeobius iranensis (3%)
  • Halonotius sp. (3%)
  • Haloplanus sp. (3%)
  • Haladaptatus litoreus (1%)
  • halophilic archaeon J07HB67 (1%)
  • uncultured archaeon A07HN63 (1%)

Как мы можем заметить, абсолютное большинство последовательностей из кластеров были обнаружены в бактерии вида Halobacterium salinarum (в огромном множестве разных её штаммов). Это говорит о том, что бактериородопсин может быть очень не распространённым белком, раз встречается в большинстве случаев в одном виде бактерии.

Также заметим, что при переходе от UniRef100 к UniRef90 количество записей в кластерах сильно увеличивается, с 4 до 60, но организм, в котором этот белок встречается, при этом не меняется. Это только укрепляет предположение о том, что бактериородопсин нельзя назвать распространённым белком. Ведь даже при отклонении идентичности первичной структуры белка на 10%, его организменное местоположение никак не поменялось.

По таблице мы видим, что при переходе от UniRef90 к UniRef50 количество записей увеличивается не так сильно, как при переходе с UniRef100 к UniRef90. Это может нам сказать о повышенной консервативноссти белка. Близких бактериородопсину по струкутре белков гораздо больше, чем далёких.

Результаты сеансов поиска UniProt

Результаты сеансов поиска UniProt
Область поиска Запрос в строке поиска Всего нашлось в Swiss-Prot Всего нашлось Комментарий
По рекомендованному названию name:bacteriorhodopsin 15 916 -
По рекомендованному названию среди белков организма name:bacteriorhodopsin organism:"halobacterium salinarum strain atcc 700922 jcm 11081 nrc-1" 3 5 Только 2 из 5 полученных результата являются непосредственно бактериородопсинами
По рекомендованному названию среди белков организмов того же семейства (Halobacteriaceae) name:bacteriorhodopsin taxonomy:halobacteriaceae 8 83 Большинство результатов относятся к uncultured haloarchaeon и Halobacterium salinarum (80-90%)
По рекомендованному названию среди белков организмов того же типа (Euryarchaeota) name:bacteriorhodopsin taxonomy:euryarchaeota 15 493 Тут уже абсолютное большинство белков-бактериородопсинов и на них похожих, а также около 20% белков принадлежат uncultured Halobacteriales archaeon
По актину name:actin 1199 99482 Очевидно, что без ограничения поиска по организмам количество записей будет огромным
По актину среди белков членистоногих name:actin taxonomy:arthropoda 63 7379 Количество записей заметно уменьшилось, что логично, т. к. мы сильно сузили круг поиска. Очевидно, что актин имеется в организмах типа Членистоногие
По актину среди белков настоящих грибов name:actin taxonomy:fungi 215 38017 Для меня оказалось удивительным то, что если отсеивать записи, относящиеся к актину, по настоящим грибам (Fungi), то мы в итоге получаем больше записей, нежели в прошлом результате по Arthropoda
По трипсину name:trypsin 320 29929 -
По трипсину, исключая ингибиторы трипсина name:trypsin NOT name:inhibitor 104 24960 -

История записи

История записи P02945 будет доступна вам по ссылке.

Из интересных фактов:

Изучение ключей таблицы локальных особенностей (FT, Feature Table)

Нестандартные аминокислотные остатки

В строках FT нестандартные а. о. обозначаются ключевым словом NON_STD. Показывает наличие в первичной структуре белка селеноцистеина (Sec, U) и пирролизина (Pyl, O). Пример:

  FT   NON_STD         356
  FT                   /note="Pyrrolysine"
  FT                   /evidence="ECO:0000250"

Посттрансляционные модификации

Они обозначаются ключевым словом MOD_RES. Показывают наличие каких-либо посттрансляционных модификаций аминокислотных остатков (в том числе фосфорилирование). Пример:

  FT   MOD_RES         206
  FT                   /note="Phosphoserine; by CK1"
  FT                   /evidence="ECO:0000269|PubMed:8999878"

Гликозилирование

Присоединение сахаров обозначается отдельным ключевым словом в FT - CARBOHYD. Показывает присоединение какого-либо сахара к а. о. белка. Если в названии сахара присутствует заключающее троеточие, то это значит, что после названных сахаров цепь продолжается; если троеточия нет, то значит, что присоединён моносахарид. Пример:

  FT   CARBOHYD        53
  FT                   /note="N-linked (GlcNAc...) asparagine"
  FT                   /evidence="ECO:0000269|PubMed:19159218"

Дисульфидные связи

Наличие дисульфидной связи кодируется в строках FT ключом DISULFID. Через троеточие показывает 2 а. о., которые соединены S-S связью. Если написан лишь 1 номер а. о., значит связь межцепочечная. Например:

  FT   DISULFID        23..84
  FT                   /evidence="ECO:0000305"

Варианты последовательностей

Под ключом VAR_SEQ в строках FT пишут про возможные варианты последовательности, связанные с альтернативным сплайсингом, использованием альтернативных (допольнительных) промоторов, альтернативным началом считывания или рибосомального фреймшифтинга. Пример:

  FT   VAR_SEQ         653..672
  FT                   /note="VATSNPGKCLSFTNSTFTFT -> ALVSHHCPVEAVRAVHPTRL (in isoform 2)"
  FT                   /evidence="ECO:0000303|PubMed:12034717, ECO:0000303|PubMed:12435728"
  FT                   /id="VSP_003786"

Аминокислотные остатки, стоящие НЕ друг за другом

Случаи, когда выясняется, что 2 следующих друг за другом а. о. на самом деле стоят НЕ друг за другом, а между ними находится нерасшифрованный участок последовательности, кодируются ключом NON_CONS. Пример:

  FT   NON_CONS        52..53
  FT                   /evidence="ECO:0000305"

Вторичная структура белка

Если для белка известна вторичная структура, то в Feature Table участки вторичной структуры помечают отдельными ключевыми словами:

Пример:

  FT   HELIX           3..12
  FT                   /evidence="ECO:0000244|PDB:1HB6"

Источник полученной информации доступен по ссылке.