Геномное окружение. База данных GO

1. Получение информации о КОГе, к которому относится ваш белок

Анализируемый белок: ALV22298.1 hypothetical protein NY10_1699 [Carnobacterium sp. CP1]

Fasta-файл белка

Первым делом мы произвели анализ с помощью сервиса CDD (Conserved Domain Database)

Результат работы сервиса проведень на рисунке ниже

Далее с помощью последнего релиза базы данных был охарактеризован наш КОГ:

COG1477 - Thiamine biosynthesis lipoprotein ApbE

Идентификатор КОГа COG1477
e-value для отнесения белка к данному КОГу 3.36e-124
Interval 2-335
Название КОГа и функциональную категорию на английском языке Thiamine biosynthesis lipoprotein ApbE [Coenzyme transport and metabolism]
Перевод названия КОГа и функциональной категории на русский язык Тиамин биосинтеза липопротеина ApbE [Транспорт и метаболизм кофермента]

2. Визуализация геномного окружения

Далее было получено изображение геномного окружения для обнаруженного КОГа с помощью COGNAT.

На изображении ниже указана первая попытка запустить COGNAT

Результат: COGNAT.pdf

В дальнейшем значение параметра Occurrence Threshold (%) было заменено на 10

На изображении ниже указан результат второго запуска COGNAT

Результат: COGNAT1.pdf

Геномное окружение консервативным во всех наблюдаемых случаях, вариабельности нет.

3. Отнесение белка hypothetical protein NY10_1699 из Carnobacterium sp. CP1 к терминам GO

С помощью инструмента AmiGO поиском BLAST обнаружен в БД GO белок, который наиболее похож на исследуемый.

Эти две находки имеют одинаковую последовательность, единый организм, но разные названия и идентификаторы.

Как видно на приведенном выше изображении, P-value находки равен 6.9e-31. Далее приведены изображения выравниваний:

В дальнейшем будем считать, что это один и тот же белок (данные проверены для обоих идентификаторов).

Эти две бактерии (бактерия-хозяин исследуемого белка и бактерия, найденная в БД GO) относятся к межранговому домену (подцарство?) Террабактерий.

Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot Q3Z659

Аспект

Идентификатор GO

Название термина

Перевод названия термина

Код типа достоверности

Биологический процесс (Biological process)

GO:0006807

nitrogen compound metabolic process

Метаболический процесс связывания азота

ISS

Молекулярная функция(?)

GO:0003674

molecular_function

судя по всему, нет названия

ND

Таблица 2. Описание кодов достоверности, использованных в Таблице 1.

Код типа достоверности

Расшифровка кода типа достоверности

Объяснение

ISS

Inferred from Sequence or structural Similarity

Данный код присваивается в случае, когда используется комбинация основанных на последовательности инструментов или методов. ISS может также использоваться для указания структурного сходства с экспериментально охарактеризованными генными продуктами, что определяется с помощью кристаллографии, ядерного магнитного резонанса или компьютерного прогнозирования.

ND

No biological Data available

Данный код присваивается в случае, когда информация о молекулярной функции, биологическом процессе или клеточном компоненте гена или аннотируемого генного продукта недоступна.

Итак, мною был произведен поиск гомолога белка, данного мне в первом семестре. В результате анализа был выявлен ген, находящийся в совершенно не близкородственном организме. Информация по нему имела довольно странный вид, многие данные были недоступны.


© Grigorjeva Masha