Знакомство с UniProt

В данном практикуме предстоит разобраться с устройством базы данных UniProt. Для этого мне предлагают провести работу со своим белком, а именно найти необходимую информацию о нём с помощью UniProt.

Заголовок 1. Получение информации о белке LARA_THETC

Чтобы получить необходимую информацию о белке, следует воспользоваться формой "Retrieve/ID mapping". Для этого понадобится GeneBank ID белка (для LARA_THETC это ADL69171.1). Далее по ссылке, обозначающей UniProt ID белка, перейти на страницу со всей необходимой информацией. Полученная мной информация представлена в Таблице 1.

Таблица 1. Основная информация о белке LARA_THETC из UniProt.
UniProt ID LARA_THETC
UniProt AC D9TQ02
Название белка Lactate racemase
RefSeq ID WP_013298138.1
PDB ID 2YJG
Длина белка (а.о.) 426
Молекулярная масса (Да) 46879
Рекомендуемое название Lactate racemase

Комментарий к таблице 1.На сайте UniProt белок представлен полной цепью, состоящей из 426 аминокислот. Его кодирует ген под названием larA. Из сайта PDB также известно, что информация о структуре белка получена методом рентгеноструктурного анализа.

Lactate racemase интересен тем, что катализирует взаимодействие между D-и L-изомерами лактата, давая организму возможность использовать оба изомера. Геномные исследования показывают широкое распространение лактатной рацемазной системы среди прокариот, что свидетельствует о высокой значимости обоих изомеров в метаболизме углерода.

Изомеризация

lactate racemase

Lactate racemase

lactate racemase

Заголовок 2. Поиск белка LARA_THETC в UniRef

Для нахождения кластеров белка в строку поиска был введён UniProt AC белка и выбрана база данных UniRef. Информация из UniRef представлена в Таблице 2.

Таблица 2. Кластеры UniRef, содержащие белок LARA_THETC.
Раздел UniRef ID кластера Название кластера Размер кластера
UniRef100 UniRef50_D9TQ02 Cluster: Lactate racemase 2
UniRef90 UniRef50_D9TQ02 Cluster: Lactate racemase 7
UniRef50 UniRef50_D9TQ02 Cluster: Lactate racemase 155

Содержание в UniRef100 всего 2 последовательностей говорит о высокой специфичности белка Lactate racemase.

Заголовок 3. Сеансы поиска в UniProt"

Чтобы сориентироваться в обширной базе данных UniProt, необходимо познакомиться с синтексом запросов для поиска белков по различным категориям. В этом очень помогает меню "Advanced". Так были проделаны следующие сеансы поиска.

Поиск Лактата рацемазы

Поиск гомеобоксов

Поиск трипсинов

При поиске с помощью Advanced при введении категорий, появляются уточняющие параметры, нередко в виде последовательности цифр в квадратных скобках. Если понимать значение этих уточнений, это наверняка ещё больше упрощает поиск и помогает найти нужную информацию.