Uniprot. Поиск по аннотации

Uniprot. Поиск по аннотации

Были найдены все белки - компоненты АТФ синтазы, закодированные в геноме бактерии Methanoculleus marisnigri. В табл.1 показано несколько промежуточных запросов для поиска.

Геном или таксон Строка запроса Число записей Комментарии
штаммы Methanoculleus marisnigri organism:"methanoculleus marisnigri" 2476 Полное название организма "Methanoculleus marisnigri (strain ATCC 35101 / DSM 1498 / JR1)"
геном Methanoculleus marisnigri organism:"methanoculleus marisnigri strain atcc 35101 dsm 1498 jr1" 2476 То же число результатов...
геном Methanoculleus marisnigri organism:"methanoculleus marisnigri" AND name:atpase 40 Много лишних
геном Methanoculleus marisnigri organism:"methanoculleus marisnigri" AND gene:atp* 8 То что нужно
геном Methanoculleus bourgensis organism:"methanoculleus bourgensis" AND gene:atp* 10

Таблица 1. Таблица запросов для поиска белков - компонентов АТФ-синтазы в Uniprot

Изображение правильного результата поиска показано на рис.1. В результате было найдено 8 компонентов АТФ синтазы. 4 из них вошли в раздел белков, проверенных экспертом. Судя по полю Protein existence, структура всех белков была выведена из гомологичных. Кодирующие гены всех компонентов синтазы, за исключением одной D-субъединицы и одной C, расположены близко в геноме, судя по полю Gene names. fasta-файл с последовательностями всех компонентов АТФ-синтазы можно скачать по этой ссылке.

Рисунок 1. Результат поиска

Был также выполнен аналогичный поиск в полном геноме археи другого вида того же рода (Methanoculleus bourgensis). Правильный запрос для поиска указан в табл.1. Изображение результата приведено на рис.2. Удалось найти 10 компонентов, причём ни один из белков не относится к разделу белков, проверенных экспертом. Также структуры всех субъединиц выведены из гомологичных, за исключением I-субъединицы - она предсказана, выведена из последовательности ДНК и в действительности не обнаружена. Все гены, кодирующие компоненты АТФ-синтазы, расположены близко, за исключением тех что кодируют одну из двух D- и одну из двух C-субъединиц. Файл с последовательностями в формате fasta можно скачать по этой ссылке.

Рисунок 2. Результат поиска для M. bourgensis

Нужно было найти гомологов для A-субъединицы АТФ-синтазы. Запрос для поиска: atpa AND organism:methano*, число находок - 78. Результат приведён на рис.3, выделены выбранные субъединицы. fasta-файл с гомологами можно скачать по этой ссылке.

Рисунок 3. Результат поиска гомологов

© Gordeev Anton
Дата последнего изменения 25.12.2013