UniProt

Цель этого практикума - получение основных навыков работы с базой данных UniProt.

Получение информации о белке ADZ91893.1

В базах данных UniProt, PDB получена информация об идентификаторах L-лизин-6-оксидазы, её длине, молекулярной массе и вторичной структуре. Данные представлены в Таблице 1.

Таблица 1. Основная информация о белке LODA_MARM1 из UniProt.
UniProt ID UniProt AC RefSeq ID PDB ID Длина белка (а.о.) Молекулярная масса (Да) Рекомендуемое название
LODA_MARM1 F2JXJ3; Q24K54; WP_013661796.1, NC_015276.1 2YMW;3WEU;3WEV 726 80880 L-lysine 6-oxidase

PDB-структура известна далеко не для всего белка, который представлен двумя цепями (A, B). Структура белка была получена с помощью рентгеноструктурного анализа.

"Поиск белка LODA_MARM1 в UniRef"

По UniProt AC белка в базе данных UniRef были найдены кластеры близких последовательностей (UniRef100, UniRef90, UniRef50), их ID, названия и размеры. Все полученные данные приведены в Таблице 2.

Таблица 2. Кластеры UniRef, содержащие белок LODA_MARM1.
Раздел UniRef ID кластера Название кластера Размер кластера
UniRef100 L-lysine 6-oxidase UniRef100_F2JXJ3 2
UniRef90 L-lysine 6-oxidase UniRef90_F2JXJ3 2
UniRef50 L-lysine 6-oxidase UniRef50_F2JXJ3 20

UniRef представляет собой наборы последовательностей из базы UniProt, сгруппированные по уровню идентичности. Так, UniRef100 состоит из идентичных последовательностей и их фрагментов, 90 объединяет все последовательности совпадающие не менее чем на 90 процентов и перекрывающиеся как минимум на 80 % с самой длинной из UniRef100.

"Сеансы поиска в UniProt"

Для знакомства с синтаксисом запросов в UniProt были проведены следующие сеансы поиска."

Поиск L-лизина-6-оксидазы

Поиск альбуминов

Поиск трипсинов

Очень большое количество белков аннотировано людьми вручную, но при этом тысячи записей все еще ожидают проверки. Наибольшее число аннотированных белков принадлежат, что не удивительно, человеку, а вот второй "по популярности"организм для анализа трипсинов меня немного удивил - почему-то проанализированных трипсинов дрозофил почти в полтора раза больше, чем мышиных.