1. Нахождение информации о своем белке в UniProt

       С этим беком я уже сталкивался в практикуме Визуализация молекул в JMol.
 С помощью функции "Retrieve/ID mapping" я нашёл страницу белка. Для более удобной работы с базой данных я перешёл в  текстовый режим(Format → Text).
 В левом столбце были записаны двухбуквенные обозначения, по которым довольно просто ориентироваться:
 • DE - рекомендуемое название;
 • DR - идентификаторы PDB и RefSeq, длина белка(а.о.);
 • SQ - длина в аминокислотных остатках и молекулярная масса (MW) в дальтонах;
 • CC - описание белка(что-то интересное о нём).
UniProt KB Unreviewed
UniProt ID Q3ZDM6_PSEPU
UniProt AC Q3ZDM6
EMBL AC AY957609
PDB ID 3L5L,3L5M,3L65,3L66,3L67,3L68,3N14,
3N19,4UTH,4UTI,4UTJ,4UTK,4UTM,4UTL
Длина белка (а.о.) 363
Молекулярная масса (Да) 39872
Рекомендуемое название Xenobiotic reductase
Таблица 1. Основная информация о белке Q3ZDM6_PSEPU из UniProt.

Комментарии:

    Организм у которого обнаружен белок: Pseudomonas putida
     Дополнительно: другие белки Pseudomonas putida на PDB

2. Описание кластеров UniRef белка

         Для каждого белка UniProt есть ровно по одному кластеру в UniRef50, UniRef90 и UniRef100. Существуют различные
   способы найти их. В нижней части страницы я нашёл ссылку: Sequence clusters (UniRef).
   Вставив UniProt ID белка я получил таблицу. Важная для отчёта информация представленна в таблице 2:
Раздел UniRef ID кластера Название кластера Размер кластера
UniRef100 UniRef100_Q3ZDM6 Cluster: Xenobiotic reductase 4
UniRef90 UniRef90_Q9R9V9 Cluster: NADH:flavin oxidoreductase 322
UniRef50 UniRef50_Q9R9V9 Cluster: NADH:flavin oxidoreductase 1,334
Таблица 2.Кластеры UniRef, содержащие белок HCS_KITSK. из UniProt.
       Хочется отметить, что в кластере UniRef90 находится только род Pseudomonas.
  Один из представителей рода - Pseudomonas aeruginosa вызывает заболевание, относящее в достаточно интересной   группе - нозокомиальные инфекции.
       В кластере UniRef50 находятся представители не только рода Pseudomonas, что весьма логично, но и других   родов (Azotobacter,Agrobacterium и др.)

3. Сеансы поиска в UniProt

Поиск по рекомендованному названию своего белка

  Текст запроса: name:xenobiotic name:reductase
  Количество находок в Swiss-Prot: 1
  Общее количество находок: 583

Поиск по названию белка и организма одновременно

 Текст запроса: name:xenobiotic reductase organism:"pseudomonas putida"  Количество находок в Swiss-Prot: 0
 Общее количество находок: 17

Поиск по названию белка и семейства одновременно

  Текст запроса: name:xenobiotic reductase taxonomy:pseudomonadales
  Количество находок в Swiss-Prot: 0
  Общее количество находок: 396

Поиск по названию белка и отдела одновременно

 Текст запроса: name:xenobiotic reductase taxonomy:proteobacteria  Количество находок в Swiss-Prot: 0
 Общее количество находок: 504

Поиск всех актинов

  Текст запроса: name:actin
  Количество находок в Swiss-Prot: 1199
  Общее количество находок: 97385

Поиск актинов у животных

 Текст запроса: name:actin taxonomy:metazoa
 Количество находок в Swiss-Prot: 709
 Общее количество находок: 42327

Поиск актинов у зелёных растений

  Текст запроса: name:actin taxonomy:viridiplantae
  Количество находок в Swiss-Prot: 152
  Общее количество находок: 7544

Поиск трипсинов

 Текст запроса: name:trypsin
 Количество находок в Swiss-Prot: 320
 Общее количество находок: 29210

Поиск трипсинов без ингибиторов

  Текст запроса: name:trypsin NOT name:inhibitor
  Количество находок в Swiss-Prot: 104
  Общее количество находок: 24465
 

4. Изучение историии изменений записи UniProt

   В задании можно было выбрать любую запись.
   Именно поэтому я решил рассмотреть карбоксипептидазу D Хохлатой утки
   Инфомация об этом белке обновлялась 73 раза.
   Я сравнивал между собой 3 версии: первую, тридцать шестую и семьдесят третью:
Хохлатая утка)))
Номер версии 1 36 73
Дата загрузки 13/04/2003 02/03/2010 11/12/2019
Число строк в .txt формате 32 124 188
Database TrEMBL Swiss-Prot Swiss-Prot
UniProt ID P83852 CBPD_LOPSP CBPD_LOPSP
Каталитическая функция Не описана Описана Описана
Таблица 3.Сравнение записей белка

Выводы:

   • Белок достаточно давно имеет статус Swiss-Prot (5 версия записи - 04/01/2005)
   • За первые семь лет объём информации о белке сильно вырос (значительное увеличение произошло именно на 5 версии -
     было добавлено описание белка: его катализируемая реакция,лиганды и т.д.
   • Рост числа строк от 36 до 73 версий не вызван увеличением объёма информации.
     Это связано с измененением формата записи (и возможно уточнением). Например:
      Запись в 36 версии: -FT STRAND          375 377
      Запись в 73 версии: -FT STRAND          375..377
                                        -FT                           /evidence="ECO:0000244|PDB:1H8L"
   • UniProt AC, который был дан белку в 1 версии сохранился до сих пор (об этом говорилось на лекциях)

5. Ключи таблицы локальных особенностей

Особенность Ключ Пример
Нестандартные аминокислотные остатки NON_STD Селеноцистеин
Пирролизин
Посттрансляционная модификация MOD_RES Фосфотреонин
Фосфосерин
Альтернативный сплайсинг VAR_SEQ Глюкокортикоидный
рецептор человека

Дисульфидные связи DISULFID Белок томата
(Protein 108)

Варианты последовательности VARIANT Глюкокортикоидный
рецептор человека

Вторичная структура HELIX
TURN
STRAND
Спираль
Поворот
β-лист