UniProt
Цель этого практикума - получение основных навыков работы с базой данных UniProt.
Получение информации о белке ADZ91893.1
В базах данных UniProt, PDB получена информация об идентификаторах L-лизин-6-оксидазы, её длине, молекулярной массе и вторичной структуре. Данные представлены в Таблице 1.
UniProt ID | UniProt AC | RefSeq ID | PDB ID | Длина белка (а.о.) | Молекулярная масса (Да) | Рекомендуемое название |
---|---|---|---|---|---|---|
LODA_MARM1 | F2JXJ3; Q24K54; | WP_013661796.1, NC_015276.1 | 2YMW;3WEU;3WEV | 726 | 80880 | L-lysine 6-oxidase |
PDB-структура известна далеко не для всего белка, который представлен двумя цепями (A, B). Структура белка была получена с помощью рентгеноструктурного анализа.
"Поиск белка LODA_MARM1 в UniRef"
По UniProt AC белка в базе данных UniRef были найдены кластеры близких последовательностей (UniRef100, UniRef90, UniRef50), их ID, названия и размеры. Все полученные данные приведены в Таблице 2.
Раздел UniRef | ID кластера | Название кластера | Размер кластера |
---|---|---|---|
UniRef100 | L-lysine 6-oxidase | UniRef100_F2JXJ3 | 2 |
UniRef90 | L-lysine 6-oxidase | UniRef90_F2JXJ3 | 2 |
UniRef50 | L-lysine 6-oxidase | UniRef50_F2JXJ3 | 20 |
UniRef представляет собой наборы последовательностей из базы UniProt, сгруппированные по уровню идентичности. Так, UniRef100 состоит из идентичных последовательностей и их фрагментов, 90 объединяет все последовательности совпадающие не менее чем на 90 процентов и перекрывающиеся как минимум на 80 % с самой длинной из UniRef100.
"Сеансы поиска в UniProt"
Для знакомства с синтаксисом запросов в UniProt были проведены следующие сеансы поиска."
Поиск L-лизина-6-оксидазы
-
Описание запроса
Текст запроса: "l-lysine 6-oxidase"
Количество находок в Swiss-Prot: 1
Общее количество находок: 251
-
Описание запроса
Текст запроса: loda "marinomonas mediterranea strain atcc 700492 jcm 21426 nbrc 103028 mmb-1"
Количество находок в Swiss-Prot:2
Общее количество находок:4
Поиск альбуминов
-
Поиск альбумина без ограничения на организмы
Текст запроса: "albumin"
Количество находок в Swiss-Prot: 327
Общее количество находок: 4347
-
Поиск альбуминов у членистоногих
Текст запроса: "albumin arthropoda"
Количество находок в Swiss-Prot: 3
Общее количество находок: 12
-
Поиск альбуминов у позвоночных
Текст запроса: "albumin vertebrata"
Количество находок в Swiss-Prot: 195
Общее количество находок: 1710
Поиск трипсинов
-
Поиск по слову "трипсин"
Текст запроса: "trypsin"
Количество находок в Swiss-Prot: 4117
Общее количество находок: 216559
-
Поиск трипсинов, исключая их ингибиторы
Текст запроса: "trypsin NOT inhibitor"
Количество находок в Swiss-Prot: 3110
Общее количество находок: 209698
Очень большое количество белков аннотировано людьми вручную, но при этом тысячи записей все еще ожидают проверки. Наибольшее число аннотированных белков принадлежат, что не удивительно, человеку, а вот второй "по популярности"организм для анализа трипсинов меня немного удивил - почему-то проанализированных трипсинов дрозофил почти в полтора раза больше, чем мышиных.