Учебный сайт Юдиной А.С.

Главная

Обо мне

Семестры

Геномное окружение и база данных GO.

I. КОГ.

Для работы с геномным окружением был взят белок, который ранее уже рассматривался в практикумах 1 семестра. Название белка - Хитин-связывающий белок, ID - ALU92050.1.

  1. COG ID: COG3397
  2. E-value: 1.30e-39
  3. Место в белке: 13-171; Длина белка: 171 а.о.
  4. Predicted carbohydrate-binding protein, contains CBM5 and CBM33 domains.
  5. Предсказанный углерод-связывающий белок, содержащий домены CBM5 и CBM33.

II. COGNAT - COmparative Gene Neighborhood Analysis Tool

Теперь геомное окружение исследуемого белка было визуализировано в базе данных COGNAT. Задаваемые параметра менялись для лучшего обозрения геномного окружения. Вначале были установлены параметры по умолчанию: количесво белков в окружении - 7; встречаемость в 20 % организмов и больше; отображение таксономии - ДА. При этом нашлось окружение, представленное на рисунке 1. Нашелся COG5297, выполняющий функцию целлюлазы (целлобиазы CelA1).

Рис.1 В геномном окружении с COG3397 часто находится COG5297, выполняющий функцию целлюлазы (целлобиазы CelA1).

Теперь задавались параметры: количество белков в окружении - 11; встречаемость в 10 % организмов и больше; отображение таксономии - ДА. При этом помимо ранее обнаруженного COG5297 в окружении также начал встречаться COG0583, выполняющий функцию ДНК-связывающего регулятора транскрипции из семейства LysR - рис.2.

Рис.2 В геномном окружении с COG3397 часто находится COG5297, выполняющий функцию целлюлазы (целлобиазы CelA1), а аткже встречается COG0583, выполняющий функцию ДНК-связывающего регулятора транскрипции из семейства LysR.

1. Консервативность в геномном окружении не наблюдается. Если поднимать порог содержания в организмах до 30 % никакие КОГи в геномном окружении не находятся. Но на пороге 20 % COG3397 и COG5297 в некоторых случаеях оказываются слитыми в один ген.

III. Отнесение белка Chitin-binding protein из Streptomyces globisporus C1027 к терминам GO

По результатам AmiGO BLAST лучшая находка Chitin-binding protein из организма Bacillus anthracis с p-value 3.8e-14, в выравнивании нашлось 50% позитивных акминоскислотных остатков (не меняющих свои свойства), кроме того на выравнивании видны протяженные консервативные участки.

Аспект Идентификатор GO Название термина Перевод названия термина Код типа достоверности
Biological process GO:0006032 chitin catabolic process Процесс катабализма хитина ISS
molecular function GO:0008061 chitin binding Связывание хитина ISS

Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot Q81PH8 (CBP_BACAN)

Код типа достоверности Расшифровка кода типа достоверности Объяснение
ISS Inferred from Sequence or structural Similarity Данный код приписывается в случае, когда полученные вручную на основе последовательности данные аннтотированы.

Таблица 2. Описание кодов достоверности, использованных в Таблице 1.

В данном пункте работы были проанализированы данные из базы данных GO, которая является своего рода графом, связывающим разные понятия и биологияеские термины. Был найден белок, весьма похожий на исследуемый ранее, с таким же названием, но у другого организма - о качесве этой находки подробнее говорится в первом абзаце. Далее для найденного белка были описаны биологический процесс и молекулярная функция данного белка - данная информация сведена в таблицу 1. Далее были проанализированы коды типа доверенности, которые присваиваются каждому аспекту (процессу либо функции). В таблице 2 представлено описание единственного найденного кода доверенности, который говорит о том, на сколько проверена, хранящаяся в базе данных информация.


© Юдина Анастасия, 2016