Uniprot. Поиск по аннотации
Поиск белков-компонентов АТФ-синтазы
С помощью базы данных Uniprot можно найти компоненты АТФ-синтазы бактерии Chloroflexus aurantiacus штамм J-10-fl. В Таблице 1 приведены поисковые запросы, включая ошибочные, для достижения данной цели.
Поисковой запрос | Число результатов | Комментарий |
organism:"Chloroflexus aurantiacus J-10-fl" | 0 | Такого организма нет, попробуем поискать по другому названию |
organism:"Chloroflexus aurantiacus" | 28061 | Разобрались с названием |
organism:"Chloroflexus aurantiacus" AND organism:J-10-fl |
3851 | Теперь штамм правильно написан |
organism:"Chloroflexus aurantiacus" AND organism:J-10-fl AND name:ATPase |
89 | Слишком много, следовательно какого-то условия не хватает |
organism:"Chloroflexus aurantiacus" AND organism:J-10-fl AND name:ATPase AND gene:atp* |
8 | Всё правильно, но один из параметров лишний |
organism:"Chloroflexus aurantiacus" AND organism:J-10-fl AND gene:atp* |
8 | Теперь всё точно правильно |
Результат последнего (правильного) запроса представлен на Рисунке 1. Файл в формате fasta с последовательностями найденных белков можно скачать отсюда.

Рисунок 1. Белки-компоненты АТФ-синтазы C.aurantiacus.
Белки, которые вошли в раздел Swissprot, помечены звёздочкой.
Скриншот сделан с сайта Uniprot.
Всего нашлось 8 белков, 7 из которых были проверены экспертом (вошли в раздел Swissprot). Существование всех белков выведено из гомологии (inferred from homology).
Белки принадлежат одному оперону, так как их гены идут последовательно. Это также можно увидеть с помощью геномного браузера на сайте NCBI. Результат представлен на Рисунке 2.

Рисунок 2. Ко-локализованность белков АТФ-синтазы.
Рамочкой выделены гены, которые кодируют белки, входящие в состав АТФ-синтазы.
Рисунок получен с помощью геномного браузера на сайте NCBI.
Аналогичный поиск был проведён для бактерии этого же вида, но другого штамма. Ниже приведён поисковой запрос:
organism:"Chloroflexus aurantiacus" NOT organism:J-10-fl AND gene:atp*
Результат запроса представлен на Рисунке 3. Отсюда можно скачать файл с аминокислотными последовательностями найденных белков.
Всего нашлось 8 белков, 5 из них проверены экспертом. Существование белков, как и в предыдущий раз, выведено из гомологии. Белки принадлежат одному оперону.

Рисунок 3. Результат поиска компонентов АТФ-синтазы бактерии другого штамма.
Скриншот сделан с сайта Uniprot.
Поиск гомологов для одной из субъединиц АТФ-синтазы (β-субъединица)
Чтобы правильно составить поисковой запрос в Uniprot, я воспользовалась сервисом BLAST (первые 13 результатов представлены на Рисунке 4). Все белки, схожие более, чем на 69% процентов, принадлежали таксону Chloroflexi, а длина последовательности большинства из них входила в промежуток от 467 до 481.

Рисунок 4. Результат работы BLAST по поиску гомологов β-субъединицы АТФ-синтазы бактерии C.aurantiacus.
Основываясь на наблюдениях, описанных выше, я составила следующий запрос:
taxonomy:Chloroflexi AND gene:atpD AND NOT organism:"Chloroflexus aurantiacus"
AND length:[467 TO 481]
Выпало сразу десять нужных мне гомолога. Результат поиска представлен на Рисунке 5. Fasta-файл с последовательностями можно скачать отсюда.

Рисунок 5. Результат поиска гомологов β-субъединицы АТФ-синтазы бактерии C.aurantiacus.
Скриншот сделан с сайта Uniprot.