Знакомство с UniProt
В данном практикуме я нашел и проанализировал информацию о своем белке, описал его кластеры и провел несколько различных сеансов поиска в UniProt.
Получение информации о белке SALL_SALTO
Я нашел в UniProt белок по его GenBank AC, открыл его описание в текстовом формате и извлек необходимые мне данные. Полученная информация представлена в таблице 1.
UniProt ID | UniProt AC | RefSeq ID | PDB ID | Длина белка (а.о.) | Молекулярная масса (Да) | Рекомендуемое название |
---|---|---|---|---|---|---|
SALL_SALTO | A4X3Q0 | WP_011904934.1 | 2Q6I;2Q6K;2Q6L;2Q6O | 283 | 30148 | Adenosyl-chloride synthase |
Данный белок состоит из двух цепей. Самое высокое разрешение рентгеноструктурного анализа: 1.55Å. Структура белка представлена как альфа-спиралями, так и бета-тяжами, также имеются 3/10-спирали. В Uniprot дано описание функций и каталитической активности в присутствии бромида, хлорида, иодида, а также кинетических показателей этих реакций.
Поиск белка SALL_SALTO в UniRef
Белок был найден в базе UniRef по своему UniProt ID. Полученная информация представлена в таблице 2.
Раздел UniRef | ID кластера | Название кластера | Размер кластера |
---|---|---|---|
UniRef100 | UniRef100_A4X3Q0 | Adenosyl-chloride synthase | 2 |
UniRef90 | UniRef90_A4X3Q0 | Adenosyl-chloride synthase | 8 |
UniRef50 | UniRef50_A4X3Q0 | Adenosyl-chloride synthase | 11 |
По размерам кластеров белка можно оценить, насколько его последовательность распространена среди различных организмов. Данный фермент идентичен на 90% восьми другим белкам, причем все организмы которым они свойственны, принадлежат роду Salinispora. На 50% идентичные белки имеются только у двух других представителей порядка Actinomycetales. Из этого можно сделать вывод, что данный белок является специфичным для данного рода. Данный белок Salinispora tropica является очень важным объектом для изучения, так как он участвует в образовании салиноспорамида А, который можно использовать в лечении рака.Также стоит отметить, что из 11 записей, приндалежащих кластеру UniRef50_A4X3Q0 (50%), только исследуемая запись находится в курируемой базе данных Swiss-Prot.
Сеансы поиска в UniProt
Для знакомства с синтаксисом запросов в UniProt были проведены следующие сеансы поиска.
Поиск аденозил-хлоридсинтазы
Поиск по рекомендованному названию белка: Adenosyl-chloride synthase
Текст запроса: name:" adenosyl-chloride synthase " organism:" salinispora tropica"
Количество находок в Swiss-Prot: 1
Общее количество находок: 1
Поиск по рекомендованному названию среди белков Salinispora tropica
Текст запроса: name:" adenosyl-chloride synthase " organism:" salinispora tropica "
Количество находок в Swiss-Prot: 1
Общее количество находок: 1
Поиск по рекомендованному названию среди белков Salinispora tropica
Текст запроса: name:" adenosyl-chloride synthase " organism:" salinispora tropica "
Количество находок в Swiss-Prot: 1
Общее количество находок: 1
Поиск по рекомендованному названию среди белков из организмов семейства Micromonosporaceae
Текст запроса: name:"adenosyl-chloride synthase" taxonomy:Micromonosporaceae[28056]
Количество находок в Swiss-Prot: 1
Общее количество находок: 5
Поиск по рекомендованному названию среди белков из организмов отдела Actinobacteria
Текст запроса: name:"adenosyl-chloride synthase" taxonomy:Actinobacteria[201174]
Количество находок в Swiss-Prot: 1
Общее количество находок: 8
Поиск гистонов
Поиск без ограничения на организмы
Текст запроса: name:histone
Количество находок в Swiss-Prot: 2082
Общее количество находок: 152633
Поиск по моллюскам (Mollusca)
Текст запроса: name:histone taxonomy:Mollusca [6447]
Количество находок в Swiss-Prot: 22
Общее количество находок: 5737
Поиск по споровикам (Apicomplexa)
Текст запроса: name:histone taxonomy:Apicomplexa[5794]
Количество находок в Swiss-Prot: 3
Общее количество находок: 2638
Поиск трипсинов
Поиск по слову "трипсин"
Текст запроса: name:trypsin
Количество находок в Swiss-Prot: 312
Общее количество находок: 22706
Поиск трипсинов, исключая их ингибиторы
Текст запроса: name:trypsin NOT name:inhibitor
Количество находок в Swiss-Prot: 101
Общее количество находок: 18169
Исследуемый белок специфичен для бактерий рода Salinispora, что подтвердилось вышеперечисленным анализом кластеров. Интересно, что для Eimeria tenella (одного из двух видов типа Apicomplexa, которые имеют записи в Swiss-Prot) было проведено секвенирование всего генома. Записей по трипсину намного больше, чем по его ингибиторам, однако количество записей Swiss-Prot у ингибиторов выше. Это объясняется тем, что последовательностей трипсина больше, чем последовательностей его ингибиторов, но больший научный интерес представляют именно ингибиторы.