Практикум 10. Геномное окружение. База данных GO

При помощи сервиса CDD (Conserved Domain Database) был получен список находок, некоторые из которых относили белок к определенному КОГу. Такой КОГ был найден один
ID: COG1075
Название: Triacylglycerol esterase/lipase EstA, alpha/beta hydrolase fold (триглицерол эстраза/липаза EstA, альфа/бета гидролаза)
Функциональная категория: I - Lipid transport and metabolism (транспорт и метаболизм липидов)
Интервал:9-378
E-value: 4.59e-23

Задание 2


Для КОГа COG1075 с помощью сервиса COGNAT было получено геномное окружение, представленное на Рис. 1.
Параметры были выставлены:
Neighborhood Size - 9
Occurrence Threshold (%) - 20
Taxonomy - Нет
Стрелочками показаны гены. Салатовым цветом "наш" белок, относящийся к COG1075

Рис.1 Результаты поиска
Ссылка на полное изображение результов поиска
Все изображение
Как видно по рисунку при данном % не наблюдается консервативности.

3. Отнесение липазы из генома бактерии Aneurinibacillus sp. XH2 к терминам GO


При помощи инструмента AmiGO поиком BLAST в базе данных GO был обнаружен белок, наиболее похожий на липазу (Uniprot ID: A0A109QDP9_9BACL). Лучшая находка также представляла белок - липазу. (была найдена в другом организме) Исходя их параметров (p-value, % положительных аминокислот) можно сделать вывод, что это тот же белок. Лучшая находка
Организм:Bacillus anthracis str. Ames
P-value: 2.0e-127
Положительных аминокислот (сохраняющие свои свойства): 73%
Ниже представлено выравнивание Рис.2

Рис.2 Выравнивание с лучшей находкой

Таблица 1. Расшифровки белков

Аспект Идентификатор GO Название термина Перевод названия термина Код типа достоверности
Biological process (Биологический процесс) GO:0016042 lipid catabolic process Липидные катаболический процесс ISS
Molecular function (Молекулярная функция) GO:0004806 glyceride lipase activity глицерид липазная активность ISS








Таблица 2. Описание кода достоверности

Код типа достоверности Расшифровка кода типа достоверности Объяснение
ISS Inferred from Sequence or structural similarity Данный код присваивается всякий раз, когда аннотация продиктована анализом последовательностей, а также факт достоверности и аннотация проверялся вручную специалистом








В третьем задании требвалось ознакомиться с системой терминов GO. Для этого была взята последовательность "моего" белка и найдены все термины, ассоциированные с ним по данным инструмента AmiGO. Было найдено два термина с одним и тем же кодом достоверности. Данный код типа достоверности (ISS) говорит о высокой достоверности (данные были проверены вручную).