← Назад ко 2 семестру

Практикум 7. Анализ белка superoxide reductase из Pyrococcus abyssi GE5

Богданова Агата Владимировна

Факультет биоинженерии и биоинформатики, Московский государственный университет имени М. В. Ломоносова


АННОТАЦИЯ. В этой работе я рассмотрела белок superoxide reductase из археи Pyrococcus abyssi GE5. Я выбрала его для анализа, потому что у него понятная функция, хорошая аннотация в UniProt и при этом сам белок связан с интересной биологической задачей — защитой анаэробного организма от активных форм кислорода. В отчёте я кратко описала свойства белка, рассмотрела его кластеры UniRef, привела поисковые запросы в UniProt и разобрала, на каких основаниях построена его аннотация.

Ключевые слова: Pyrococcus abyssi, superoxide reductase, UniProt, UniRef, ECO, аннотация белка, гипертермофильные археи.

1. Введение

В качестве объекта для этого практикума я выбрала белок superoxide reductase из археи Pyrococcus abyssi GE5. В UniProt эта запись имеет идентификатор SOR_PYRAB и accession Q9V098.

Мне показалось, что этот белок хорошо подходит для анализа: с одной стороны, он не слишком сложный, а с другой — у него есть понятная функция и достаточно информативная аннотация. Кроме того, сам организм тоже интересен: Pyrococcus abyssi — это гипертермофильная анаэробная архея, обитающая в экстремальных условиях глубоководных гидротермальных источников.

2. Почему я выбрала именно этот белок

Я остановилась на superoxide reductase по нескольким причинам. Во-первых, это reviewed-запись в UniProt, то есть запись из Swiss-Prot, которую проверяли кураторы. Это важно, потому что для учебного анализа удобнее работать с хорошо разобранным и аккуратно аннотированным белком.

Во-вторых, функция белка выглядит очень понятной и биологически осмысленной. Он участвует в обезвреживании супероксид-аниона — одной из активных форм кислорода. Особенно интересно, что для строгого анаэроба такой белок действительно важен.

Наконец, мне показалось удачным и то, что по записи можно обсудить не только сам белок, но и более широкий биологический контекст. В отличие от superoxide dismutase, супероксидредуктаза не образует молекулярный кислород, а восстанавливает супероксид до перекиси водорода. Для анаэробного организма это выглядит вполне логичным способом защиты от окислительного стресса.

3. Основная информация о белке

Согласно данным UniProt, анализируемый белок имеет идентификатор SOR_PYRAB, accession Q9V098 и название Superoxide reductase. Он принадлежит организму Pyrococcus abyssi (strain GE5 / Orsay), TaxID 272844.

ПараметрЗначение
IDSOR_PYRAB
AccessionQ9V098
НазваниеSuperoxide reductase
ОрганизмPyrococcus abyssi (strain GE5 / Orsay)
TaxID272844
Длина115 аминокислот
Молекулярная масса13298 Da
ГенsorA
EC1.15.1.2

Белок относится к оксидоредуктазам. В аннотации UniProt указано, что он участвует в восстановлении супероксида до перекиси водорода, используя электроны, которые передаются через rubredoxin и соответствующую оксидоредуктазу.

Каталитическая реакция в записи приведена так:

reduced [rubredoxin] + superoxide + 2 H(+) = oxidized [rubredoxin] + H2O2

Для белка также указан кофактор — железо. В записи отмечены аминокислотные остатки, участвующие в его связывании: 14, 16, 41, 47, 102 и 105. Кроме того, указано, что белок существует в виде гомотетрамера.

По классификации UniProt этот белок относится к семейству desulfoferrodoxin family. Для него есть ссылки на внешние базы, в том числе InterPro, Pfam, KEGG, AlphaFoldDB и другие. При этом экспериментальной структуры в PDB для данной записи я не нашла.

С белком связаны две нуклеотидные записи: AJ248285 и HE613800. В UniProt для них есть пометка о неправильном старте трансляции, то есть белковые переводы в этих нуклеотидных записях отличаются от curated-версии UniProt по N-концу.

Файл protein_info.txt

ID:SOR_PYRAB AC:Q9V098,G8ZI59 Name:Superoxide reductase Organism:Pyrococcus abyssi (strain GE5 / Orsay) TaxID:272844 INSDC:AJ248285,HE613800 PDB: Length:115 aa MW:13298 Da

Краткое описание белка

Superoxide reductase — это небольшой железосвязывающий белок, который участвует в защите клетки от супероксид-аниона. Для белка из Pyrococcus abyssi GE5 в UniProt указано, что он восстанавливает супероксид до перекиси водорода с участием rubredoxin-зависимой системы переноса электронов. Белок состоит из 115 аминокислот и относится к семейству desulfoferrodoxin.

4. Кластеры похожих белков

Для выбранного белка я нашла кластеры UniRef100, UniRef90 и UniRef50. Они позволяют понять, сколько у белка близких и более удалённых гомологов на разных уровнях сходства последовательности.

КластерИдентификаторРазмерДлина representative sequenceНазвание
UniRef100UniRef100_Q9V0981115Superoxide reductase
UniRef90UniRef90_Q9V09823115Superoxide reductase
UniRef50UniRef50_Q9V098169115Superoxide reductase

Результат выглядит вполне ожидаемо. На уровне UniRef100 в кластер входит только одна последовательность, то есть полностью идентичных вариантов у этого белка нет. На уровне UniRef90 уже видно, что у него есть заметное число близких гомологов. А UniRef50 показывает, что это семейство в целом довольно широко распространено.

Файл protein_clusters.txt

ID:UniRef100_Q9V098 Size:1 Length:115 Name:Superoxide reductase ID:UniRef90_Q9V098 Size:23 Length:115 Name:Superoxide reductase ID:UniRef50_Q9V098 Size:169 Length:115 Name:Superoxide reductase

5. Поисковые запросы

В этом задании нужно было составить несколько запросов в расширенном поиске UniProt и объяснить, что именно они позволяют проверить. Я выбрала три разных варианта: точный поиск по accession, поиск по гену и организму и более общий поиск по ферментной функции.

5.1. Запрос 1

accession:Q9V098

Это самый прямой способ найти нужную запись. Поскольку accession уникален, такой запрос должен возвращать ровно один результат.

Вывод: accession Q9V098 однозначно соответствует выбранному белку.

5.2. Запрос 2

gene:sorA AND organism_id:272844

Этот запрос уже использует два независимых признака: название гена и идентификатор организма. Мне он показался удобным для проверки того, что в геноме Pyrococcus abyssi GE5 ген sorA действительно соответствует выбранной записи.

Вывод: ген sorA в данном организме связан с белком superoxide reductase.

5.3. Запрос 3

ec:1.15.1.2 AND reviewed:true

Этот запрос полезен уже не только для моего белка, но и для понимания того, насколько сама функция superoxide reductase представлена среди хорошо аннотированных записей. Поиск по EC-номеру удобен тем, что он опирается на ферментную классификацию, а не только на текстовое название.

Вывод: функция superoxide reductase хорошо представлена в reviewed-записях UniProt.

В целом эти запросы показывают, что выбранный белок можно уверенно идентифицировать разными способами, а его функция хорошо подтверждается аннотацией базы.

6. Дополнительное задание: источник аннотации

Отдельно я посмотрела, на каких основаниях в UniProt сделаны основные утверждения о белке. Для этого я разобрала коды ECO, которые показывают, откуда взялась та или иная аннотация.

6.1. Функция белка

Функция белка в записи сопровождается кодом ECO:0000250. Это означает, что утверждение было сделано на основании сходства последовательности и добавлено в запись вручную куратором.

То есть для самого белка Q9V098 это не обязательно прямое экспериментальное подтверждение, а скорее перенос функции по гомологии. На мой взгляд, в данном случае это выглядит вполне убедительно, потому что супероксидредуктазы — хорошо узнаваемое семейство белков.

6.2. Каталитическая активность

Для каталитической активности указан источник ECO:0000250|UniProtKB:P82385. Это значит, что аннотация была перенесена по сходству последовательности с белка из Pyrococcus furiosus.

Мне кажется, это особенно полезная информация, потому что здесь можно увидеть, из какой именно записи был сделан перенос аннотации. Если у близкого гомолога функция изучена лучше, это повышает доверие к такой аннотации.

6.3. Принадлежность к семейству

Принадлежность белка к desulfoferrodoxin family помечена кодом ECO:0000305. Этот код означает кураторский вывод.

Такая аннотация обычно основана не на одном признаке, а на совокупности данных: доменном анализе, сходстве последовательности и совпадениях с внешними базами. В данном случае это хорошо согласуется с данными InterPro, Pfam, CDD и других ресурсов.

6.4. Общий вывод по аннотации

В целом запись Q9V098 опирается в основном на кураторскую аннотацию по гомологии и на сопоставление с уже изученными белками. Хотя для самого белка набор прямых экспериментальных данных, по-видимому, ограничен, аннотация всё равно выглядит достаточно надёжной и хорошо подходит для учебного анализа.

7. Заключение

В ходе работы я проанализировала белок superoxide reductase из Pyrococcus abyssi GE5. По данным UniProt, это небольшой железосвязывающий оксидоредуктазный белок длиной 115 аминокислот, который участвует в восстановлении супероксида до перекиси водорода.

Я рассмотрела его основные характеристики, кластеры UniRef и примеры поисковых запросов, которые позволяют проверить идентичность белка и его функциональный контекст. Кроме того, разбор кодов ECO показал, что аннотация записи основана главным образом на гомологии и кураторских выводах. В целом этот белок оказался удобным и удачным объектом для учебного анализа.

8. Список источников

  1. UniProtKB entry Q9V098 (SOR_PYRAB), superoxide reductase, Pyrococcus abyssi GE5.
  2. UniProtKB entry P82385 (SOR_PYRFU), superoxide reductase, Pyrococcus furiosus.
  3. Evidence and Conclusion Ontology (ECO).
  4. Публикации, посвящённые Pyrococcus abyssi и гипертермофильным археям глубоководных гидротермальных источников.