Для выполнения данной работы использовался белок, который уже изучался ранее, это α-L-фукозидаза, являющаяся лизосомальным ферментом, участвующим в деградации различных групп естественных фукоглюкоконъюгатов [1]. Далее для определения КОГа данного белка использовался сервис CDD, в котором были найдены следующие данные для выбранной белковой последовательности:
Идентификатор КОГа - COG3669
Величина E-value для отнесения белка к данному КОГу - 1.95e-39
С какого по какой остаток белка в нем обнаруживается КОГ - 12-338
Длина белка - 444 а.о.
Название КОГа и функциональная категория - Alpha-L-fucosidase, G (Carbohydrate transport and metabolism)
Название КОГа на русском - α-L-фукозидаза, углеводный транспорт и обмен веществ
С помощью сервиса COGNAT осуществлялась визуализация геномного окружения. Данный сервис позволяет по идентификатору COG найти геномное окружение белка, в нашем случае был введен идентификатор COG3669, а также значение Neighborhood Size равное 11, Occurrence Threshold (%) - 20, Taxonomy - да. В результате при таких параметров никакого консервативного геномного окружения обнаружено не было, из чего можно сделать вывод, что при увеличении параметра Occurrence Threshold (%) шансов найти геномное окружения нет. Результат работы представлен на рис. 1, а также все находки доступны в пдф файле.
В то же время при запуске программы со значением Occurrence Threshold (%) равным 15 уже появляются какие-то гены, обладающие КОГами, в частности их 2 - это COG3119, фермент арилсульфатаза А, и COG1629, белки рецепторы внешней мембраны, однако они также не составляют консервативного геномного окружения. Результат работы представлен на рис. 2, а с полным файлом по всем находкам можно ознакомиться по ссылке в файле в пдф-формате.
С помощью сервиса AmiGO проводился поиск находок в базе данных GO, в результате чего был найден белок (он являлся лучшей находкой) fucosidase, alpha-L- 2, plasma с E-value равным 1.8e-32 из организма Danio rerio, в то время как исходным организмом являлся представитель таксона Bacteria, а это Eucariota. На рис. 3 представлено выравнивание, построенное инструментами BLAST, можно заметить, что выравнивание представлено двумя частями и число консервативных полностью позиций составляет 31%, а число позиций, в которых аминокислотны сходны по функциям составляет 50%.
Далее проводилось изучение непосредственно этой находки, при этом в Таблицу 1 внесены термины GO, связанные с данным белком.
Аспект | Идентификатор GO | Название термина | Перевод названия термина | Код типа достоверности |
biological process | GO:0005975 | carbohydrate metabolic process | процесс метаболизма углеводов | IEA |
biological process | GO:0006004 | fucose metabolic process | процесс метаболизма фукозы | IEA |
molecular function | GO:0004560 | alpha-L-fucosidase activity | активность α-L-фукозидазы | IEA |
molecular function | GO:0016787 | hydrolase activity | гидролазная активность | IEA |
После чего, для найденных кодов достоверности, в данном случае он оказался один была найдена расшифровка, указанная в Таблице 2. Коды достоверности указывают, насколько проверены данные, указанные в базе данных GO.
Код типа достоверности | Расшифровка кода типа достоверности | Объяснение |
IEA | Inferred from Electronic Annotation | Данный код присваивается автоматически, без участия человека |
Таким образом, в результате поиска в базе данных GO, лучшая находка принадлежала другому организму и не являлась полностью идентичной той, по которой проводился поиск, однако представляла собой белок со схожими функциями. При дальнейшем изучении этой находки были найдены идентификаторы GO (Таблица 1), а также проанализирована достоверность указанной в базе данных информации (Таблица 2), что выявило то, что полученные данные не являются провернными человеком, но сгенерированными автоматически.
[1]Α-L-фукозидаза |