Учебный сайт Мухалевой Лизаветы

Использование поиска в Uniprot: правильная постановка запроса.

1. Поиск всех белков-компонентов АТФ-синтазы.

       В базе данных Uniprot хранится очень много белковых последовательностей, и не всегда бывает легко найти нужную. Поэтому задачей этого практикума стало изучение функции поиска в этой базе данных и правила постановки запроса. Для освоения этих функций было предложено найти все белки-компоненты АТФ-азы, закодированные в геноме моей бактерии, Geobacter sulfurreducens PCA. Мои запросы и результаты по ним представлены в таблице 1.

Таблица 1. Запросы для поиска белков - компонент АТФ-синтазы бактерии G.sulfurrreducens PCA в Uniprot.

Геном или таксон Строка запроса Число записей Комментарии
геном Geobacter sulfurreducens PCA organism:"Geobacter sulfurreducens PCA" 0 Странно, ищем нужный запрос.
штаммы Geobacter sulfurreducens organism:"Geobacter sulfurreducens" 6,723 1) полное название организма - Geobacter sulfurreducens (strain ATCC 51573 / DSM 12127 / PCA)
2) запрос выдал все белки, относящиеся к двум штаммам Geobacter sulfurreducens
геном Geobacter sulfurreducens PCA organism:"Geobacter sulfurreducens PCA " AND organism:"PCA" 0 Думаю, стоит поизменять название.
геном Geobacter sulfurreducens PCA organism:"Geobacter sulfurreducens PCA" AND name:"ATP syntase" 0 Либо название организма опять не так написано, либо белок в базе назван по-другому
штаммы Geobacter sulfurreducens organism:"Geobacter sulfurreducens" AND name:"ATP syntase" 0 Выяснила, что название у синтазы точно не такое
штаммы Geobacter sulfurreducens organism:"Geobacter sulfurreducens" AND name:"ATPase" 101 Запрос выдал все АТФ синтазы, относящиеся к двум штаммам Geobacter sulfurreducens
геном Geobacter sulfurreducens PCA organism:"Geobacter sulfurreducens" AND name:"ATPase" AND organism:PCA 51 Запрос выдал все белки в моей бактерии, связанные с АТФ-синтазой
геном Geobacter sulfurreducens PCA organism:"Geobacter sulfurreducens" AND name:"ATPase" AND organism:PCA AND gene:atp* 9 Задание выполнено!
геном Geobacter sulfurreducens PCA organism:"Geobacter sulfurreducens" AND name:"ATPase" AND organism:PCA AND gene:atp* AND existence:predicted 0 Значит, их доказательство существования не типа "предсказаны"
геном Geobacter sulfurreducens PCA organism:"Geobacter sulfurreducens" AND name:"ATPase" AND organism:PCA AND gene:atp* AND existence:inferred from homology 9 Все компоненты АТФ-синтазы выведены про помощи гомологии

       Всего мне удалось найти 9 компонент АТФ-синтазы (результат поиска изображён на рисунке 1), имеющих следующие информационные характеристики в Uniprot:

  • 8 из них были исследованы и лежат в базе Swiss-prot, а atpX-компонента пока не была изучена (лежит в Tremble). Но тут я заметила две странности: во-первых, название компоненты atpF (B-компонента) встречается два раза - и в базе Swiss-prot, и в Tremble. Предпологаю, что это потому, что ген atpF попадает в два оперона, поэтому в запись об atpX его тоже внесли. При сравнение кода так и получается, что atpX и atpF - два разных белка, просто в оперон atpX попадает часть гена atpF, поэтому его тоже упомянули.
  • По доказательству существования все компоненты относятся к одному типу: выведены из гомологии - то есть у какой-то бактерии они точно есть (скорее всего у второго штамма Geobacter sulfurreducens), поэтому предположили, что и у Geobacter sulfurreducens PCA тоже существуют.
  • Локализация у генов белков разная - каждая компонента имеет свой локус, но следуют они друг за другом.

Скрин последнего запроса

Рисунок 1. Результат итогового запроса в поиске компонент АТФ-синтазы G.sulfurreducens штамм PCA.

       Если Вам интересно, можете посмотреть последовательности компонент АТФ-синтазы в этом fasta-файле.

2. Поиск всех белков-компонентов АТФ-синтазы бактерии другого штамма.

       Так как белки-компоненты данной АТФ-синтазы выведены из гомологии, то я решила проверить АТФ-синтазу второго штамма Geobacter sulfurreducens-Geobacter sulfurreducens (strain DL-1 / KN400): доказано ли точное существание её белков компонент. Чтобы найти их, я вводила примерно те же запросы, что и в случае с моей бактерией, поэтому полную таблицу приводить не стала. Зато как выглядит конечный запрос можно посмотреть в таблице 2.

Таблица 2. Итоговый запрос для поиска белков - компонент АТФ-синтазы бактерии G.sulfurrreducens KN400 в Uniprot.

Геном или таксон Строка запроса Число записей Комментарии
геном Geobacter sulfurreducens KN400 organism:"Geobacter sulfurreducens" AND name:"ATPase" AND organism:KN400 AND gene:atp* AND existence:inferred from homology 8 Наш результат ~^.^~

       Но, как оказалось, с белками-компонентами данного штамма дела обстоят ещё туманнее. Всего нашлось 8 субъединиц (результат запроса изображён на рисунке 2), информация о которых следующая:

  • Все 8 компонент находятся в TrEMBLE (то есть, возможно, их последовательности ещё никто не смотрел!);
  • По типу доказательства существования все выведены из гомологии;
  • По локализации: atpX, atpF, atpH, atpA, atpG, atpD, atpC - их локусы идут друг за другом и находятся на одном опероне (по данным DOOR2), а atpB находится совершенно в другом месте.

Скрин последнего запроса

Рисунок 2. Результат итогового запроса в поиске компонент АТФ-синтазы G.sulfurreducens штамм KN400.

       Заинтересовавшиеся могут скачать или посмотреть fasta-файл с последовательностями здесь.

3. Поиск гомологов для одной из субъединиц АТФ-синтазы.

       АТФ-синтаза - это важный белок для организма, поэтому он имеется не только у моей бактерии. Так что следующим заданием по освоению Uniprot стал поиск 10 гомологов одной из субъединиц АТФ-синтазы. Что такое белки-гомологи? Это белки, выполняющие сходные или одинаковые функции и имеющие одинаковое эволюционное происхождение генов. Для их поиска я воспользовалась функцией Uniprot - BLAST. Как таковой запрос я не формировала - программа просто сравнила последовательности, поэтому в качестве запроса служит белковая последовательность, которуя я и привела в таблице 3. А на рисунке 3 приведён список гомологов, найденных программой (не всех, а всего лишь находящихся на первой странице поиска).

Таблица 3. Запрос для поиска белков - гомологов α-субъединицы АТФ-синтазы бактерии G.sulfurrreducens PCA в Uniprot.

Запрос Число находок в Swiss-prot Число находок в TrEMBLE
>sp|Q74GY2|ATPA_GEOSL ATP synthase subunit alpha OS=Geobacter sulfurreducens (strain ATCC 51573 / DSM 12127 / PCA) GN=atpA PE=3 SV=1
MEIRAEEISEIIRKQIKEYGKEVEVAETGTIISVGDGIARIHGLDKAMAGELLEFPGGVS
GMVLNLEEDNVGAAILGEDNENIKEGTTVKRTGRIVEVPVGEALIGRVVNAIGQPIDGKG
PINTTTFGKVEVKAPGIVKRKSVHQPMQTGLKAIDSMVPIGRGQRELIIGDRQTGKTAVA
IDTIINQKGGDLICIYVAIGQKRSTVAQVVSKLQEYGAMDYTIVVSASASEPAPLQFIAP
YTGVTMGEYFRDNGKHALIIYDDLSKQAVAYRQLSLLLRRPPGREAYPGDVFYLHSRLLE
RAAKLSDDCGAGSLTALPIIETQAGDVSAYIPTNVISITDGQIYLESDLFYSGVRPAINV
GLSVSRVGGSAQVKAMKQVAGTLRLNLAQYREMAAFAQFGSDLDKATQMQLARGERLVEI
LKQPQYRPIPNEKQVLVIFAANNGFVDEYPVSSLRRYESELYSFFDSRKADILAELRDKK
AIDDDLKAKMIAALEELKKEFTA
57 193

       Организмы, чьи белки я выбрала в качестве гомологов:

  1. Лежащие в Swiss-prot:
  2. Лежащие в TrEMBLE:
Скрин последнего запроса

Рисунок 3. Результат запроса в поиске белков-гомологов α-субъединицы АТФ-синтазы G.sulfurreducens штамм PCA, имеющих PDB-запись.

       Желающие могут посмотреть последовательности белков-гомологов в данном fasta-файле.

5. Изучение протеома бактерии G.sulfurreducens PCA.

       Протеомом называют совокупность всех белков, закодированных в геноме. В основном, на Uniprot можно их найти, поэтому задачей данного практикума стало упорядочивание информации по белкам моей бактерии. Результат Вы можете увидеть в таблице 5.

Таблица 5. Сводная таблица протеома бактерии G.sulfurrreducens PCA в Uniprot.

Доказательство существования Число записей в Swiss-prot Число записей в TrEMBLE
Evidence at protein level /
Эксперементально подтвержденное существование
0 36
Evidence at transcript level /
Есть данные об экспрессии генов
0 0
Inferred from homology /
Выявлено по гомологии
405 474
Predicted /
Предполагаемые
0 2,491
Uncertain /
Существование подвержено сомнению
0 0

       Как можно увидеть из таблицы, в просмотренные записях (Swiss-prot) находятся белки, выведенные по гомологии, в количестве 405 штук, в то время как в непросмотренных в основном лишь предполагаемые в районе 2,500. Из этого можно сделать вывод, что G.sulfurreducens PCA - не очень изученная бактерия, но ею продолжают заниматься, так как я находила записи, соответствующие датам уже этого года (2014-го).

© Mukhaleva Elizaveta, FBB MSU, 2013
Дата последнего изменения: 03.04.2014

Valid HTML 4.01 Strict Правильный CSS!