Геномное окружение. База данных GO

1. Получение информации о КОГе, к которому относится мой белок

Задания выполнялись для белка из первого семестра - CRISPR-ассоциированного белка Csn1. Сначала последовательность белка в формате fasta была загружена в сервис CDD (Conserved Domain Database). В результатах поиска в разделе хитов был найден AC КОГа этого белка, он был найден в последнем релизе базы данных COG.

    Полученная информация:
  • Идентификатор КОГа - COG3513.
  • Величина e-value для отнесения данного белка к данному КОГу - 7.65e-40
  • С какого по какой остаток белка в нем обнаруживается КОГ - 12-872; сколько всего в белке остатков - 1269;
  • Название КОГа: CRISPR/Cas system Type II associated protein, contains McrA/HNH and RuvC-like nuclease domains (белок, ассоциированный с CRISPR/Cas-системой второго типа, содержащий McrA/HNH и RuvC-подобный нуклеазные домены);
  • Функциональная категория - Defense mechanisms (защитные механизмы)

2. Визуализация геномного окружения

С помощьюе COGNAT было получено изображение геномного окружения для обнаруженного КОГа. На рис. 1 представлен фрагмент выдачи программы, на рис. 2 фрагмент сохраненных данных - начало и конец списка находок, а также обозначения цветов (ген, отнесенный к выбранному КОГу - фиолетовый, часто встречающееся геномное окружение - голубое и сиреневое). Параметры запуска COGNAT: Neighborhood Size - 9, Occurrence Threshold (%) - 20, Taxonomy - нет. Каждая стрелочка - ген (показано 9 в каждой находке - в соответствии с Neighborhood Size). Геномные окружения отсортированы в соответствии с множественным выравниванием выбранного КОГа


Рис. 1. Находки


Рис. 2. Находки (сохраненные данные)

Отнесение CRISPR-ассоциированного белка Csn1 из бактерии Mycoplasma gallisepticum S6 к терминам GO

С помощью BLAST сервиса AmiGO был найден белок CRISPR-associated endonuclease Cas9/Csn1 (это тот же белок) из Streptococcus pyogenes serotype M1, p-value находки 7.4e-12 (это и была самая лучшая находка). В таблице 1 приведены некоторые сведения об этом белке, в таблице 2 - расшифровка и объяснение кодов достоверности из таблицы 1..

АспектИдентификатор GOНазвание терминаПеревод названия терминаКод типа достоверности
Биологический процесс (Biological process)GO:0043571maintenance of CRISPR repeat elementsподдержание стабильности элементов CRISPR-повторовIDA
Компонент клетки (Сellular component)----
Молекулярная функция (Molecular function)GO:0008408
GO:0003677
GO:0004520
3'-5' exonuclease activity
DNA binding
Endodeoxyribonuclease activity
3'-5' эндонуклеазная активность
Связывание с ДНК
Эндодезоксирибонуклеазная активность
IDA
IDA
IDA

Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot Q99ZW2 (CAS9_STRP1)

Код типа достоверностиРасшифровка кода типа достоверностиОбъяснение
IDAInferred from Direct Assay указывает на то, что был проведен диохимический или биологический анализ для подтверждения анотации продукта гена: молекулярной функции, роли в биологическом процессе или внутриклеточной локации.

Таблица 2. Описание кодов достоверности, использованных в Таблице 1.



НАЗАД ➜
© <Рюмина Екатерина>, 2018