Геномное окружение. База данных GO

1. Получение информации о КОГе, к которому относится мой белок

Работа производилась с белком с идентификатором YP_004245953.1.

ID E-value Координаты(длина) Название Функциональная группа
COG1735 5.26e-100 12-315(304) Predicted metal-dependent hydrolase, phosphotriesterase family (предсказанная металлозависимая гидролаза, семейство фосфотриестираз) R - General function prediction only (Предсказание только общей функции)
COG1099 2.03e-03 165-312(148) Predicted metal-dependent hydrolase, TIM-barrel fold (предсказанная металлозависимая гидролаза, свертка Тимы-бочки) R - General function prediction only (Предсказание только общей функции)

2. Визуализация геномного окружения

Для дальнейшей работы был выбран КОГ с наименьшим E-value (COG1735). Геномное окружение было получено с помощью STRING с параметрами по умолчанию.

map

Рисунок 1. Геномное окружение COG1735, полученное в программе STRING.

map

Рисунок 2. Легенда к геномному окружению.

map

Рисунок 3. Функциональные взаимосвязи с другими белками графа.

map

Рисунок 4. Соседи в различных организмах.

map

Рисунок 5. Совместная встречаемость генов.

Из рисунков 1-5 можно сделать вывод, что у данного КОГа нету консервативного окружения (Рис. 1-3: все связи с другими белками основаны на соупоминании в статьях; Рис. 4-5: отсутсвие совместной встречаемости).

3. Отнесение белка с идентификатором YP_004245953.1 из Vulcanisaeta moutnovskia к терминам GO

С помощью инструмента AmiGO поиском BLAST в БД GO был обнаружен белок, похожий на наш. Выравнивание имеет E-value 4.8e-31. Найденный белок не является тем же самым, что и у нас, и принадлежит рыбе Danio rerio. Danio rerio является чуть более сложной формой жизни нежели наша архея, однако они имеют одинаковую среду обитания - воду (хим. состав и температура - это мелочи; так же как и то, что следующими в списке идут собаки, свиньи и люди). Таким образом, мы, удостоверившись в похожести находки, можем смело перекидывать ее ассоциации на наш белок, чем мы и займемся в таблицах 1-2.

Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot Z4YJ58

АспектИдентификатор GOНазвание терминаПеревод названия терминаКод типа достоверности
Биологический процессGO:0009056Catabolic processКатаболический процессIEA
Клеточный компонентGO:0005575Cellular componentКлеточный компонентND
Функция молекулыGO:0016787Hydrolase activityГидролазная активностьIEA
Функция молекулыGO:0046872Metal ion bindingПрицепление металлических ионовIEA
Функция молекулыGO:0008270Zinc ion bindingПрицепление цинковых ионовIEA

Таблица 2. Описание кодов достоверности, использованных в Таблице 1

Код типа достоверностиРасшифровка кода типа достоверностиОбъяснение
IEAInferred from Electronic AnnotationИнформация получена автоматически исходя из похожести последовательностей в базах данных и не рецензирована.
NDNo Biological Data AvailableНету источника, на который можно сослаться