Учебный сайт Светланы Яровенко
» Семестры » Второй семестр » Uniprot. Поиск по аннотации

Uniprot. Поиск по аннотации

Поиск белков-компонентов АТФ-синтазы

С помощью базы данных Uniprot можно найти компоненты АТФ-синтазы бактерии Chloroflexus aurantiacus штамм J-10-fl. В Таблице 1 приведены поисковые запросы, включая ошибочные, для достижения данной цели.


Таблица 1. Запросы для поиска АТФ-синтазы бактерии Chloroflexus aurantiacus штамм J-10-fl в Uniprot
Поисковой запрос Число результатов Комментарий
organism:"Chloroflexus aurantiacus J-10-fl" 0 Такого организма нет, попробуем поискать по другому названию
organism:"Chloroflexus aurantiacus" 28061 Разобрались с названием
organism:"Chloroflexus aurantiacus"
AND organism:J-10-fl
3851 Теперь штамм правильно написан
organism:"Chloroflexus aurantiacus"
AND organism:J-10-fl AND name:ATPase
89 Слишком много, следовательно какого-то условия не хватает
organism:"Chloroflexus aurantiacus"
AND organism:J-10-fl AND name:ATPase AND gene:atp*
8 Всё правильно, но один из параметров лишний
organism:"Chloroflexus aurantiacus"
AND organism:J-10-fl AND gene:atp*
8 Теперь всё точно правильно

Результат последнего (правильного) запроса представлен на Рисунке 1. Файл в формате fasta с последовательностями найденных белков можно скачать отсюда.

Результат последнего (правильного) запроса

Рисунок 1. Белки-компоненты АТФ-синтазы C.aurantiacus.
Белки, которые вошли в раздел Swissprot, помечены звёздочкой. Скриншот сделан с сайта Uniprot.

Всего нашлось 8 белков, 7 из которых были проверены экспертом (вошли в раздел Swissprot). Существование всех белков выведено из гомологии (inferred from homology).

Белки принадлежат одному оперону, так как их гены идут последовательно. Это также можно увидеть с помощью геномного браузера на сайте NCBI. Результат представлен на Рисунке 2.

Ко-локализованность белков АТФ-синтазы

Рисунок 2. Ко-локализованность белков АТФ-синтазы.
Рамочкой выделены гены, которые кодируют белки, входящие в состав АТФ-синтазы.
Рисунок получен с помощью геномного браузера на сайте NCBI.


Аналогичный поиск был проведён для бактерии этого же вида, но другого штамма. Ниже приведён поисковой запрос:
organism:"Chloroflexus aurantiacus" NOT organism:J-10-fl AND gene:atp*


Результат запроса представлен на Рисунке 3. Отсюда можно скачать файл с аминокислотными последовательностями найденных белков.

Всего нашлось 8 белков, 5 из них проверены экспертом. Существование белков, как и в предыдущий раз, выведено из гомологии. Белки принадлежат одному оперону.

Результат поиска компонентов АТФ-синтазы бактерии другого штамма

Рисунок 3. Результат поиска компонентов АТФ-синтазы бактерии другого штамма.
Скриншот сделан с сайта Uniprot.

Поиск гомологов для одной из субъединиц АТФ-синтазы (β-субъединица)

Чтобы правильно составить поисковой запрос в Uniprot, я воспользовалась сервисом BLAST (первые 13 результатов представлены на Рисунке 4). Все белки, схожие более, чем на 69% процентов, принадлежали таксону Chloroflexi, а длина последовательности большинства из них входила в промежуток от 467 до 481.

Метод, использованный Гёрдоном в исследовании

Рисунок 4. Результат работы BLAST по поиску гомологов β-субъединицы АТФ-синтазы бактерии C.aurantiacus.

Основываясь на наблюдениях, описанных выше, я составила следующий запрос:
taxonomy:Chloroflexi AND gene:atpD AND NOT organism:"Chloroflexus aurantiacus"
AND length:[467 TO 481]


Выпало сразу десять нужных мне гомолога. Результат поиска представлен на Рисунке 5. Fasta-файл с последовательностями можно скачать отсюда.

Метод, использованный Гёрдоном в исследовании

Рисунок 5. Результат поиска гомологов β-субъединицы АТФ-синтазы бактерии C.aurantiacus.
Скриншот сделан с сайта Uniprot.


Наверх