Поиск по аннотации




Второй семестр

Семестры

Главная



В базе данных UniProt есть возможность удобного поиска по любому полю записи белка. В первом семестре рассматривалась бактерия Dinoroseobacter shibae. С помощью UniProt я нашел компоненты ее АТФ-синтазы. В таблице 1 представлены этапы постепенного уточнения данных.

Таблица 1. Поиск белков-компонентов АТФ-синтазы бактерии Dinoroseobacter shibae [1]

1

Таким образом, было найдено 19 записей о компонентах, 10 из которых были просмотрены и подтверждены экспертом. Результаты последнего запроса находятся в таблице 2.

Таблица 2. Найденные компоненты АТФ-синтазы бактерии Dinoroseobacter shibae

1

Как видно из таблицы 2, достоверность существования всех белков довольна низкая. Из функция установлена исходя из гомологии с белками близких организмов, а для 4 белков вообще нет доказательств, они только предполагаемые.

Здесь можно скачать последовательности компонентов АТФ-синтазы бактерии Dinoroseobacter shibae.

По названию локусов, в которых расположены белки можно определить, как далеко в геноме они находятся, так как номера генов идут подряд в геноме. Тогда можно выделить 3 группы колокализованных белков, причем в рамках группы они находятся подряд, без пропусков. Это подтверждает, что удалось найти все компоненты АТФ-синтазы.

Других культивируемых организмов того же рода в базе UniProt нет. Тогда я нашел белки АТФ-синтазы бактерий того же семейства (rhodobacteraceae):

taxonomy:rhodobacteraceae NOT organism:dinoroseobacter (gene:atp* OR name:f0f1)

Найдено 1493 автоматически аннотированных записи и 89 из Swiss-Prot. Есть всего два организма из этого семейства с экспериментально доказанным существованием белков АТФ-синтазы, это можно определить с помощью команды

taxonomy:rhodobacteraceae (gene:atp* OR name:f0f1) NOT existence:"inferred from homology" NOT existence:predicted

Этот запрос дает 16 аннотированных вручную записей. Один из организмов - paracoccus denitrificans. Поиск по этой бактерии (штамм pd 1222) дает 8 записей, 7 из них из Swiss-Prot:

organism:"paracoccus denitrificans" organism:"pd 1222" (gene:atp* OR name:f0f1)

Результат представлен в таблице 3.

Таблица 3. Найденные компоненты АТФ-синтазы бактерии paracoccus denitrificans

1

Гены образуют 2 близко локализованные группы идущих подряд белков. Однако пропущен ген Pden_2876. Отдельный поиск для него дает такую запись. Это тоже компонент АТФ-синтазы. То есть изначально были найдены не все. Тогда изменим запрос:

organism:"paracoccus denitrificans" organism:"pd 1222" (gene:atp* OR name:f0)

Тогда найдено 9 белков. Здесь (2.fasta) можно скачать последовательности компонентов АТФ-синтазы бактерии paracoccus denitrificans. Результат представлен в таблице 4.

Таблица 4. Найденные компоненты АТФ-синтазы бактерии paracoccus denitrificans

1

Для поиска гомологов я использовал сервис blast на сайте базы данных UniProt. Запросом была последовательность субъединица beta-1 АТФ-синтазы Dinoroseobacter shibae. Всего было найдено 250 записей, из которых 18 относятся к Swiss-Prot.

Белков с известной третичной структурой найдено не было. Поэтому я выбрал 10 из тех, что аннотированы вручную и находятся максимально далеко на филогенетическом дереве. Таким образом набор содержит последовательности белков представителей разных отрядов. На рисунке 1 представлено окно выдачи uniprot blast с выбранными последовательностями. Первая строчка – запись белка, поданного на вход алгоритму blast.

1

Рисунок 1. Результаты поиска гомологов beta-2 субъединицы АТФ-синтазы




© Рябых Григорий, 2016

Последнее обновление: 29.02.2016