Геномное окружение. База данных GO

Получение информации о КОГе бифункциональной 5,10-метилентетрагидрофолатдегидрогеназы / 5,10-метилен-тетрафолатациклогидролазы

Рассматривался белок, уже встречавшийся нам в одном из практикумов первого семестра. Для него были определны:

Идентификатор КОГа ~ COG0190
Величина e-value при отнесении данного белка к выбранному КОГу ~ 1.97e-148
Границы обнаружения КОГа ~ с 4 по 275 остаток (общая длина белка составляет 285 а.к.о.)
Название КОГа ~ 5,10-methylene-tetrahydrofolate dehydrogenase/Methenyl tetrahydrofolate cyclohydrolase (5,10-метилентетрагидрофолатдегидрогеназа / метилентетрагидрофолатциклогидролаза)
Функциональная категория ~ H : Coenzyme transport and metabolism (Транспорт и метаболизм коферментов)

Всего было обнаружено два КОГа, с e-value 1.97e-148 и 8.17e-03. Для выполнения задания был выбран КОГ с наименьшим e-value

Визуализация геномного окружения

Далее с помощью COGNAT были получено изображение геномного окружения для обнаруженного КОГа.

Рис.1 Геномное окружения КОГа.


Поиск проводился с сохранением исходных параметров [Neighborhood Size (9); Occurrence Threshold (%) (20); Taxonomy (Нет)].
На изображении, слева, указаны организмы (их тип и вид), для которых рассматривалось геномное окружение. Справа - непосредственно окно с геномным окружением. Каждой стрелке соответствует определенный ген. Цветными стрелками обозначаются гены, которые встречаются с определенной частотой (параметр Threshold). По Рис.1 легко определить, что геномное окружение белка не консервативно. Чтобы просмотреть полный список геномного окружения, намите сюда.

Поиск в базе данных GO

Мой белок взят из генома бактерии Burkholderia sp. MSMB122.
С помощью инструмента AmiGO поиском BLAST в БД GO был обнаружен белок, который наиболее похож на мой. Это GSU_0862, бифункциональный белок FolD 2 из генома Geobacter sulfurreducens PCA. Его p-value 2.5e-74. Его функция та же самая, что и у анализируемого мной белка, но он принадлежит другому организму. На Рис.2 представлено выравнивание этих белков (BLAST match).

Рис.1 Выравнивание моего белка и найденного в БД GO.


По результатам запроса была получена информация, выписанная в Табл.1. Расшифровка и объяснение кодов достоверности предоставлены в Табл.2.

Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot Q74EU7.
Аспект Идентификатор GO Название термина Перевод названия термина Код типа достоверности
Biological process GO:0009257 10-formyltetrahydrofolate biosynthetic process 10-формилтетрагидрофолатный процесс биосинтеза ISS
Biological process GO:0000105 histidine biosynthetic process биосинтез гистидина ISS
Biological process GO:0009086 methionine biosynthetic process биосинтез метионина ISS
Biological process GO:0015940 pantothenate biosynthetic process биосинтез пантотената ISS
Biological process GO:0009113 purine nucleobase biosynthetic process биосинтез пуриновых нуклеотидов ISS
Molecular function GO:0004477 methenyltetrahydrofolate cyclohydrolase activity активность метилентетрагидрофолата в отношении циклогидролазы ISS
Molecular function GO:0004486 methylenetetrahydrofolate dehydrogenase [NAD(P)+] activity активность метилентетрагидрофолатдегидрогеназы [NAD (P) +] ISS


Таблица 2. Описание кодов достоверности, использованных в Таблице 1.
Код типа достоверности Расшифровка кода типа достоверности Объяснение
ISS Inferred from Sequence or structural Similarity Используется в случае, когда комплекс инструментов и методов базируется на последовательности. Общий тип для данных, основанных на последовательности. Код указывается всякий раз, когда основанный на последовательности анализ является основой для аннотации.






На Главную страницу
На страницу Семестра