С этим беком я уже сталкивался в практикуме Визуализация молекул в JMol.
С помощью функции "Retrieve/ID mapping" я нашёл страницу белка. Для более удобной работы с базой данных я перешёл в текстовый режим(Format → Text).
В левом столбце были записаны двухбуквенные обозначения, по которым довольно просто ориентироваться:
• DE - рекомендуемое название;
• DR - идентификаторы PDB и RefSeq, длина белка(а.о.);
• SQ - длина в аминокислотных остатках и молекулярная масса (MW) в дальтонах;
• CC - описание белка(что-то интересное о нём).
Для каждого белка UniProt есть ровно по одному кластеру в UniRef50, UniRef90 и UniRef100. Существуют различные
способы найти их. В нижней части страницы я нашёл ссылку: Sequence clusters (UniRef).
Вставив UniProt ID белка я получил таблицу. Важная для отчёта информация представленна в таблице 2:
Таблица 2.Кластеры UniRef, содержащие белок HCS_KITSK. из UniProt.
Хочется отметить, что в кластере UniRef90 находится только род Pseudomonas.
Один из представителей рода - Pseudomonas aeruginosa
вызывает заболевание, относящее в достаточно интересной группе - нозокомиальные инфекции.
В кластере UniRef50 находятся представители не только рода Pseudomonas, что весьма логично,
но и других родов (Azotobacter,Agrobacterium и др.)
• Белок достаточно давно имеет статус Swiss-Prot (5 версия записи - 04/01/2005)
• За первые семь лет объём информации о белке сильно вырос (значительное увеличение произошло именно на 5 версии -
было добавлено описание белка: его катализируемая реакция,лиганды и т.д.
• Рост числа строк от 36 до 73 версий не вызван увеличением объёма информации.
Это связано с измененением формата записи (и возможно уточнением). Например:
Запись в 36 версии: -FT STRAND 375 377
Запись в 73 версии: -FT STRAND 375..377 -FT /evidence="ECO:0000244|PDB:1H8L"
• UniProt AC, который был дан белку в 1 версии сохранился до сих пор (об этом говорилось на лекциях)