Геномное окружение. База данных GO
Получение информации о КОГе бифункциональной 5,10-метилентетрагидрофолатдегидрогеназы / 5,10-метилен-тетрафолатациклогидролазы
Рассматривался
белок, уже встречавшийся нам
в одном из практикумов первого семестра. Для него были определны:
Идентификатор КОГа ~
COG0190
Величина e-value при отнесении данного белка к выбранному КОГу ~ 1.97e-148
Границы обнаружения КОГа ~ с 4 по 275 остаток (общая длина белка составляет 285 а.к.о.)
Название КОГа ~ 5,10-methylene-tetrahydrofolate dehydrogenase/Methenyl tetrahydrofolate cyclohydrolase
(5,10-метилентетрагидрофолатдегидрогеназа / метилентетрагидрофолатциклогидролаза)
Функциональная категория ~ H : Coenzyme transport and metabolism (Транспорт и метаболизм коферментов)
Всего было обнаружено два КОГа, с e-value 1.97e-148 и 8.17e-03. Для выполнения задания был выбран КОГ с наименьшим e-value
Визуализация геномного окружения
Далее с помощью COGNAT были получено изображение геномного окружения для обнаруженного КОГа.
Рис.1 Геномное окружения КОГа.

Поиск проводился с сохранением исходных параметров [Neighborhood Size (9); Occurrence Threshold (%) (20); Taxonomy (Нет)].
На изображении, слева, указаны организмы (их тип и вид), для которых рассматривалось геномное окружение. Справа - непосредственно
окно с геномным окружением. Каждой стрелке соответствует определенный ген. Цветными стрелками обозначаются гены, которые встречаются
с определенной частотой (параметр Threshold). По Рис.1 легко определить, что геномное окружение белка не консервативно.
Чтобы просмотреть полный список геномного окружения, намите
сюда.
Поиск в базе данных GO
Мой белок взят из генома бактерии Burkholderia sp. MSMB122.
С помощью инструмента AmiGO поиском BLAST в БД GO был обнаружен белок, который наиболее похож на мой. Это GSU_0862, бифункциональный
белок FolD 2 из генома Geobacter sulfurreducens PCA. Его p-value 2.5e-74. Его функция та же самая, что и у анализируемого мной белка,
но он принадлежит другому организму. На Рис.2 представлено выравнивание этих белков (BLAST match).
Рис.1 Выравнивание моего белка и найденного в БД GO.

По результатам запроса была получена
информация, выписанная в Табл.1. Расшифровка и объяснение кодов достоверности предоставлены в Табл.2.
Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot Q74EU7.
Аспект |
Идентификатор GO |
Название термина |
Перевод названия термина |
Код типа достоверности |
Biological process |
GO:0009257 |
10-formyltetrahydrofolate biosynthetic process |
10-формилтетрагидрофолатный процесс биосинтеза |
ISS |
Biological process |
GO:0000105 |
histidine biosynthetic process |
биосинтез гистидина |
ISS |
Biological process |
GO:0009086 |
methionine biosynthetic process |
биосинтез метионина |
ISS |
Biological process |
GO:0015940 |
pantothenate biosynthetic process |
биосинтез пантотената |
ISS |
Biological process |
GO:0009113 |
purine nucleobase biosynthetic process |
биосинтез пуриновых нуклеотидов |
ISS |
Molecular function |
GO:0004477 |
methenyltetrahydrofolate cyclohydrolase activity |
активность метилентетрагидрофолата в отношении циклогидролазы |
ISS |
Molecular function |
GO:0004486 |
methylenetetrahydrofolate dehydrogenase [NAD(P)+] activity |
активность метилентетрагидрофолатдегидрогеназы [NAD (P) +] |
ISS |
Таблица 2. Описание кодов достоверности, использованных в Таблице 1.
Код типа достоверности |
Расшифровка кода типа достоверности |
Объяснение |
ISS |
Inferred from Sequence or structural Similarity |
Используется в случае, когда комплекс инструментов и методов базируется на последовательности.
Общий тип для данных, основанных на последовательности. Код указывается всякий раз, когда основанный на последовательности
анализ является основой для аннотации. |
На Главную страницу
На страницу Семестра