В данном практикуме предстоит разобраться с устройством базы данных UniProt. Для этого мне предлагают провести работу со своим белком, а именно найти необходимую информацию о нём с помощью UniProt.
Заголовок 1. Получение информации о белке LARA_THETC
Чтобы получить необходимую информацию о белке, следует воспользоваться формой "Retrieve/ID mapping". Для этого понадобится GeneBank ID белка (для LARA_THETC это ADL69171.1). Далее по ссылке, обозначающей UniProt ID белка, перейти на страницу со всей необходимой информацией. Полученная мной информация представлена в Таблице 1.
UniProt ID | LARA_THETC |
---|---|
UniProt AC | D9TQ02 |
Название белка | Lactate racemase |
RefSeq ID | WP_013298138.1 |
PDB ID | 2YJG |
Длина белка (а.о.) | 426 |
Молекулярная масса (Да) | 46879 |
Рекомендуемое название | Lactate racemase |
Комментарий к таблице 1.На сайте UniProt белок представлен полной цепью, состоящей из 426 аминокислот. Его кодирует ген под названием larA. Из сайта PDB также известно, что информация о структуре белка получена методом рентгеноструктурного анализа.
Lactate racemase интересен тем, что катализирует взаимодействие между D-и L-изомерами лактата, давая организму возможность использовать оба изомера. Геномные исследования показывают широкое распространение лактатной рацемазной системы среди прокариот, что свидетельствует о высокой значимости обоих изомеров в метаболизме углерода.
Изомеризация
Lactate racemase
Заголовок 2. Поиск белка LARA_THETC в UniRef
Для нахождения кластеров белка в строку поиска был введён UniProt AC белка и выбрана база данных UniRef. Информация из UniRef представлена в Таблице 2.
Раздел UniRef | ID кластера | Название кластера | Размер кластера |
---|---|---|---|
UniRef100 | UniRef50_D9TQ02 | Cluster: Lactate racemase | 2 |
UniRef90 | UniRef50_D9TQ02 | Cluster: Lactate racemase | 7 |
UniRef50 | UniRef50_D9TQ02 | Cluster: Lactate racemase | 155 |
Содержание в UniRef100 всего 2 последовательностей говорит о высокой специфичности белка Lactate racemase.
Заголовок 3. Сеансы поиска в UniProt"
Чтобы сориентироваться в обширной базе данных UniProt, необходимо познакомиться с синтексом запросов для поиска белков по различным категориям. В этом очень помогает меню "Advanced". Так были проделаны следующие сеансы поиска.
Поиск Лактата рацемазы
-
Поиск белков по рекомендованному краткому названию
Текст запроса: 'name:lar'
Количество находок в Swiss-Prot: 23
Общее количество находок: 4812
-
Поиск по тому же названию среди белков бактерии Thermoanaerobacterium thermosaccharolyticum (strain ATCC 7956 / DSM 571 / NCIB 9385 / NCA 3814)
Текст запроса: 'name:lar organism:"thermoanaerobacterium thermosaccharolyticum strain atcc 7956 dsm 571 ncib 9385 nca 3814"'
Количество находок в Swiss-Prot: 1
Общее количество находок: 2
-
Поиск по тому же названию среди белков из организмов семейства Clostridia
Текст запроса: 'name:lar taxonomy:clostridia'
Количество находок в Swiss-Prot: 1
Общее количество находок: 799
-
Поиск по тому же названию среди белков из организмов отдела Firmicutes
Текст запроса: 'name:lar taxonomy:firmicutes'
Количество находок в Swiss-Prot: 14
Общее количество находок: 1420
Поиск гомеобоксов
-
Поиск гомеобоксов без ограничения на организмы
Текст запроса: 'name:homeobox'
Количество находок в Swiss-Prot: 1397
Общее количество находок: 90142
-
Поиск гомеобоксов в организмах животных
Текст запроса: 'name:homeobox taxonomy:metazoa'
Количество находок в Swiss-Prot: 1141
Общее количество находок: 67180
-
Поиск гомеобоксов в организмах позвоночных
Текст запроса: 'name:homeobox taxonomy:vertebrata'
Количество находок в Swiss-Prot: 995
Общее количество находок: 47606
Поиск трипсинов
-
Поиск по слову "трипсин"
Текст запроса: 'name:trypsin'
Количество находок в Swiss-Prot: 318
Общее количество находок: 26544
-
Поиск трипсинов, исключая их ингибиторы
Текст запроса: 'name:trypsin NOT name:inhibitor'
Количество находок в Swiss-Prot: 102
Общее количество находок: 21717
При поиске с помощью Advanced при введении категорий, появляются уточняющие параметры, нередко в виде последовательности цифр в квадратных скобках. Если понимать значение этих уточнений, это наверняка ещё больше упрощает поиск и помогает найти нужную информацию.