Работа с базой данных UniProt

1. Выбор белка

Для выполнения работы была выбрана бактерия Thermoactinomyces vulgaris. Поиск белков осуществлялся с помощью расширенного поиска (Advanced Search) на сайте UniProt.

Запрос:

taxonomy_id:2026 AND reviewed:true


Результат поиска:

Запрос вернул 5 рецензированных (Swiss-Prot) записей.


Обоснование выбора:

Белок привлёк внимание тем, что он хорошо изучен и аннотирован (Swiss-Prot). Для него известна кристаллическая структура, подробно описан каталитический механизм. Уникальной особенностью карбоксипептидазы T является двойная субстратная специфичность (гидролиз C-концевых как гидрофобных/ароматических, так и основных аминокислот), что делает её интересным объектом для эволюционных и структурно-функциональных исследований. Ну, а ещё он был первым в списке



2. Информация о белке

Название белка (на русском)

Карбоксипептидаза T


Краткое описание функции:

Карбоксипептидаза T — это внеклеточная Zn-зависимая металлопротеаза, продуцируемая термофильной бактерией Thermoactinomyces vulgaris. Фермент гидролизует C-концевые пептидные связи, отщепляя как гидрофобные/ароматические (фенилаланин, лейцин), так и основные (лизин, аргинин) аминокислоты. Благодаря термостабильности и широкой субстратной специфичности фермент представляет интерес для биотехнологии.


Интересные данные из записи:

Белок синтезируется в виде неактивного препрофермента и активируется путём отщепления N-концевого пропептида. Для термостабильности требуется присутствие ионов Ca²⁺, а для каталитической активности — ион Zn²⁺ в активном центре.


Файл protein_info.txt

3. Кластеры похожих белков (UniRef):

Для белка P29068 были найдены кластеры UniRef100, UniRef90 и UniRef50. Информация получена через FASTA-заголовки кластеров со страниц UniRef.

Кластер ID Кластера Размер (Size) Длина (Length) Название
UniRef100 UniRef100_P29068 3 424 Carboxypeptidase T
UniRef90 UniRef90_P29068 7 424 Carboxypeptidase T
UniRef50 UniRef50_P29068 122 424 Carboxypeptidase T

Интерпретация размеров кластеров:

UniRef100 (Size = 3):

В кластере 100% идентичности находятся 3 белка. Помимо самого P29068, это две архивные записи UniParc (UPI0000112895 и UPI00024ED2A2), вероятно, представляющие собой фрагменты или изоформы того же белка из Thermoactinomyces vulgaris.


UniRef90 (Size = 7):

7 белков с идентичностью ≥90%. Это близкие гомологи карбоксипептидазы T, встречающиеся в семействе Thermoactinomycetaceae. Размер 7 указывает на то, что белок хорошо консервативен в пределах этого семейства.


UniRef50 (Size = 122):

122 белка с идентичностью ≥50%. Гомологи обнаруживаются уже в пределах типа Bacillati (включает Bacillota и родственные термофильные бактерии). Размер 122 свидетельствует об умеренной эволюционной консервативности: белок не является уникальным, но и не относится к широко распространённым «домашним» белкам (у которых размер UniRef50 может достигать тысяч).

Вывод:

Карбоксипептидаза T не является уникальным белком только для Thermoactinomyces vulgaris , но имеет ограниченное распространение в пределах термофильных бактерий. Умеренный размер кластера UniRef50 (122) указывает на то, что фермент эволюционно консервативен, но сохраняет видовую/родовую специфичность.


Файл protein_clusters.txt

4. Поисковые запросы

В рамках задания было составлено несколько поисковых запросов для демонстрации различных возможностей расширенного поиска UniProt и получения биологической информации о карбоксипептидазе T.

Запрос 1 (По EC номеру)

Цель:

Найти все карбоксипептидазы T (EC 3.4.17.18) в базе UniProt

Запрос:

ec:3.4.17.18

Количество находок:

1849

Вывод:

Карбоксипептидаза T (EC 3.4.17.18) — фермент, встречающийся преимущественно у бактерий. Количество найденных записей отражает его распространённость в природе.

Запрос 2 (По структуре PDB)

Цель:

Найти карбоксипептидазы, для которых известна трёхмерная структура в PDB.

Запрос:

database:pdb AND protein_name:carboxypeptidase

Количество находок:

116

Вывод:

Многие карбоксипептидазы имеют экспериментально подтверждённую структуру. Для карбоксипептидазы T (P29068) существует несколько PDB-структур (например, 4IHM, 7AQP), что позволяет изучать её каталитический механизм на атомном уровне.

Запрос 3 (По термостабильности)

Цель:

Найти рецензированные карбоксипептидазы, аннотированные как термостабильные.

Запрос:

protein_name:"Thermostable carboxypeptidase" AND reviewed:true

Количество находок:

5

Вывод:

В базе UniProt найдено 5 рецензированных термостабильных карбоксипептидаз. Среди них — белок CBP1_THET8 из Thermus thermophilus (Q5SLM3) и CBP2_THET8 (Q5SLM2). Сам белок P29068 (карбоксипептидаза T из Thermoactinomyces vulgaris) также является термостабильным: согласно литературной аннотации в UniProt, его активность возрастает с температурой до 70 °C, а ионы Ca²⁺ дополнительно стабилизируют фермент.

Запрос 4 (По конкретному организму)

Цель:

Найти все протеазы, кодируемые Thermoactinomyces vulgaris.

Запрос:

database:pdb AND protein_name:carboxypeptidase

Количество находок:

74

Вывод:

T. vulgaris кодирует несколько протеаз, включая термитазу (P04072) и карбоксипептидазу T (P29068). Это отражает способность бактерии утилизировать внешние белки как источник питательных веществ.