Формирование поискового запроса в UniProt


сайт ФББ

сайт МГУ

Поиск компонент ATФ-синтазы Streptococcus pneumoniae штамм P1031

Ход поиска можно проследить в таблице 1.

Таблица 1. Запросы для поиска белков-компонент АТФ-синтазы пневмококка

Строка запроса

Число записей

Комментарий

1

organism:"Streptococcus pneumoniae" AND name:atp*

21086

Слишком много, нужно уточнить штамм бактерии.

2

organism:"Streptococcus pneumoniae P1031" AND name:atp*

0

Нужно было указать штамм, как подсказывал поисковик, а то он меня не понимает.

3

name:atp* AND organism:"Streptococcus pneumoniae (strain P1031) [488223]"

102

Гораздо лучше, но замечаю, что выводятся результаты, садержащие "atp+что-то" не только в коротком названии гена. Уточню.

4

name:ATP synthase AND organism:"Streptococcus pneumoniae (strain P1031) [488223]"

8

Ура, согласуется с данными, полученными здесь.

Удалось найти 8 компонент АТФ-синтазы, 7 из которых вошли в раздел Swissprot (то есть были проверены экспертом), 1 осталась в TrEMBL. Доказательства существования всех белков были выведены из гомологии. Все компоненты ко-локализованы, то есть их гены находятся рядом.

Скриншот

Рис. 1. Скриншот результатов правильного запроса для поиска компонент АТФ-синтазы пневмококка в Uniprot

Скачать файл с последовательностями всех компонент можно здесь.

Поиск компонент ATФ-синтазы Streptococcus thermophilus штамм LMG 18311

Я выбрала эту бактерию для поиска компонент АТФ-синтазы, так как был секвенирован ее полный геном. По аналогии с правильным запросом для пневмококка для поиска я составила следующий запрос:

name: ATP synthase AND organism:"Streptococcus thermophilus (strain ATCC BAA-250 / LMG 18311) [264199]"

Запрос выдал 7 компонент АТФ-синтазы, 6 из которых вошли в раздел Swissprot, 1 осталась в TrEMBL. Доказательства существования всех белков были выведены из гомологии. Все компоненты ко-локализованы.

Скриншот

Рис. 2. Скриншот результатов запроса для поиска компонент АТФ-синтазы термококка в Uniprot

Скачать файл с последовательностями всех компонент можно здесь.

Поиск гомологов cубъединицы А

Для поиска гомологов использовался сервис BLAST, ищущий сходные с данной, а значит, скорее всего, гомологичные ей последовательности.

Скриншот

Рис. 3. Запрос для BLAST. Количество востребованных находок увеличено до 1000 из-за большого чиста идентичных или практически идентичных данной последовательностей.

Скриншот

Рис. 4. Скриншот выыбранных находок

Из выданных 1000 результатов я выбрала 10 (выбирала проверенные, преимущественно из разных видов), файл с последовательностями этих белков в формате fasta представлен здесь.

Данные об изученности Streptococcus pneumoniae штамм P1031 на молекулярном уровне

Таблица 2. Сводная таблица протеома пневмококка

Значение PE

Запрос

Количество находок

Всего

Swissprot

TrEMBL

Bсе

organism:"Streptococcus pneumoniae (strain P1031) [488223]"

2069

282

1787

Uncertain

organism:"Streptococcus pneumoniae (strain P1031) [488223]" AND existence:uncertain

0

0

0

Predicted

organism:"Streptococcus pneumoniae (strain P1031) [488223]" AND existence:predicted

1389

0

1389

Inferred prom homology

organism:"Streptococcus pneumoniae (strain P1031) [488223]" AND existence:"inferred from homology"

677

279

398

Evidence at transcript level

organism:"Streptococcus pneumoniae (strain P1031) [488223]" AND existence:"evidence at transcript level"

0

0

0

Evidence at protein level

organism:"Streptococcus pneumoniae (strain P1031) [488223]" AND existence:"evidence at protein level"

3

3

0

Из таблицы видно, что, хоть геном пневмококка и был изучен полностью, но не был изучен основательно. Существование почти всех белков либо предсказано, либо выведено из гомологии.

© Дарья Горбачева

изменено 8.08.2014