Получение информации о КОГе, к которому относится белок

Для выполнения данной работы использовался белок, который уже изучался ранее, это α-L-фукозидаза, являющаяся лизосомальным ферментом, участвующим в деградации различных групп естественных фукоглюкоконъюгатов [1]. Далее для определения КОГа данного белка использовался сервис CDD, в котором были найдены следующие данные для выбранной белковой последовательности:

  1. Идентификатор КОГа - COG3669

  2. Величина E-value для отнесения белка к данному КОГу - 1.95e-39

  3. С какого по какой остаток белка в нем обнаруживается КОГ - 12-338

  4. Длина белка - 444 а.о.

  5. Название КОГа и функциональная категория - Alpha-L-fucosidase, G (Carbohydrate transport and metabolism)

  6. Название КОГа на русском - α-L-фукозидаза, углеводный транспорт и обмен веществ

Визуализация геномного окружения

С помощью сервиса COGNAT осуществлялась визуализация геномного окружения. Данный сервис позволяет по идентификатору COG найти геномное окружение белка, в нашем случае был введен идентификатор COG3669, а также значение Neighborhood Size равное 11, Occurrence Threshold (%) - 20, Taxonomy - да. В результате при таких параметров никакого консервативного геномного окружения обнаружено не было, из чего можно сделать вывод, что при увеличении параметра Occurrence Threshold (%) шансов найти геномное окружения нет. Результат работы представлен на рис. 1, а также все находки доступны в пдф файле.

Рис. 1. Результат поиска в COGNAT.

В то же время при запуске программы со значением Occurrence Threshold (%) равным 15 уже появляются какие-то гены, обладающие КОГами, в частности их 2 - это COG3119, фермент арилсульфатаза А, и COG1629, белки рецепторы внешней мембраны, однако они также не составляют консервативного геномного окружения. Результат работы представлен на рис. 2, а с полным файлом по всем находкам можно ознакомиться по ссылке в файле в пдф-формате.

Рис. 2. Результат поиска в COGNAT.

Отнесение белка α-L-фукозидазы из Arthrobacter sp.A3 к терминам GO

С помощью сервиса AmiGO проводился поиск находок в базе данных GO, в результате чего был найден белок (он являлся лучшей находкой) fucosidase, alpha-L- 2, plasma с E-value равным 1.8e-32 из организма Danio rerio, в то время как исходным организмом являлся представитель таксона Bacteria, а это Eucariota. На рис. 3 представлено выравнивание, построенное инструментами BLAST, можно заметить, что выравнивание представлено двумя частями и число консервативных полностью позиций составляет 31%, а число позиций, в которых аминокислотны сходны по функциям составляет 50%.

Рис. 3. Полученное выравнивание.

Далее проводилось изучение непосредственно этой находки, при этом в Таблицу 1 внесены термины GO, связанные с данным белком.

Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot Q68EI7 (Zgc:92013).
Аспект Идентификатор GO Название термина Перевод названия термина Код типа достоверности
biological processGO:0005975carbohydrate metabolic processпроцесс метаболизма углеводовIEA
biological processGO:0006004fucose metabolic processпроцесс метаболизма фукозыIEA
molecular functionGO:0004560alpha-L-fucosidase activityактивность α-L-фукозидазыIEA
molecular functionGO:0016787hydrolase activityгидролазная активностьIEA

После чего, для найденных кодов достоверности, в данном случае он оказался один была найдена расшифровка, указанная в Таблице 2. Коды достоверности указывают, насколько проверены данные, указанные в базе данных GO.

Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot Q68EI7 (Zgc:92013).
Код типа достоверности Расшифровка кода типа достоверности Объяснение
IEAInferred from Electronic AnnotationДанный код присваивается автоматически, без участия человека

Таким образом, в результате поиска в базе данных GO, лучшая находка принадлежала другому организму и не являлась полностью идентичной той, по которой проводился поиск, однако представляла собой белок со схожими функциями. При дальнейшем изучении этой находки были найдены идентификаторы GO (Таблица 1), а также проанализирована достоверность указанной в базе данных информации (Таблица 2), что выявило то, что полученные данные не являются провернными человеком, но сгенерированными автоматически.

Источники:

[1]Α-L-фукозидаза