Практикум 10. Геномное окружение. База данных GO
При помощи сервиса CDD (Conserved Domain Database)
был получен список находок, некоторые из которых относили белок к определенному КОГу.
Такой КОГ был найден один
ID: COG1075
Название: Triacylglycerol esterase/lipase EstA, alpha/beta hydrolase fold (триглицерол эстраза/липаза EstA,
альфа/бета гидролаза)
Функциональная категория: I - Lipid transport and metabolism (транспорт и метаболизм липидов)
Интервал:9-378
E-value: 4.59e-23
Задание 2
Для КОГа COG1075 с помощью сервиса COGNAT было получено геномное окружение, представленное на Рис. 1.
Параметры были выставлены:
Neighborhood Size - 9
Occurrence Threshold (%) - 20
Taxonomy - Нет
Стрелочками показаны гены. Салатовым цветом "наш" белок, относящийся к COG1075
Рис.1 Результаты поиска
Ссылка на полное изображение результов поиска
Все изображение
Как видно по рисунку при данном % не наблюдается консервативности.
3. Отнесение липазы из генома бактерии Aneurinibacillus sp. XH2 к терминам GO
При помощи инструмента AmiGO поиком BLAST в базе данных GO был обнаружен белок, наиболее похожий на липазу
(Uniprot ID: A0A109QDP9_9BACL). Лучшая находка также представляла белок - липазу.
(была найдена в другом организме)
Исходя их параметров (p-value, % положительных аминокислот) можно сделать вывод, что это тот же белок.
Лучшая находка
Организм:Bacillus anthracis str. Ames
P-value: 2.0e-127
Положительных аминокислот (сохраняющие свои свойства): 73%
Ниже представлено выравнивание Рис.2
Рис.2 Выравнивание с лучшей находкой
Таблица 1. Расшифровки белков
| Аспект |
Идентификатор GO |
Название термина |
Перевод названия термина |
Код типа достоверности |
| Biological process (Биологический процесс) |
GO:0016042 |
lipid catabolic process |
Липидные катаболический процесс |
ISS |
| Molecular function (Молекулярная функция) |
GO:0004806 |
glyceride lipase activity |
глицерид липазная активность |
ISS |
Таблица 2. Описание кода достоверности
| Код типа достоверности |
Расшифровка кода типа достоверности |
Объяснение |
| ISS |
Inferred from Sequence or structural similarity |
Данный код присваивается всякий раз, когда аннотация продиктована анализом последовательностей,
а также факт достоверности и аннотация проверялся вручную специалистом |
В третьем задании требвалось ознакомиться с системой терминов GO.
Для этого была взята последовательность "моего" белка и найдены все термины,
ассоциированные с ним по данным инструмента AmiGO. Было найдено два термина с одним и тем же кодом достоверности.
Данный код типа достоверности (ISS) говорит о высокой достоверности (данные были проверены вручную).