Главная
О себе
Список курсов
Сайт ФББ

Геномное окружение. База данных GO

Получение информации о КОГе

Для выполнения данного практикума использовался белок с идентификатором ALX10644.1 - короткоцепочечная дегидрогеназа из Burkholderia cepacia JBK9.

С помощью CDD было обнаружено, что белок относится к КОГу с названием FabG (какое совпадение с предыдущим практикумом!) и имеет код COG1028 с e-value 5.53*10-22. КОГ обнаруживается с 1 по 191 остатки. Всего в белке 225 аминокислотных остатков. Название и семейство КОГа на английском: NAD(P)-dependent dehydrogenase, short-chain alcohol dehydrogenase family. Перевод: НАДФ-зависимая дегидрогеназа, семейство короткоцепочечных алкоголь-дегидрогеназ. Функциональная категория имеет код IQR: I - транспорт и метаболизм липидов, Q - биосинтез, транспорт и катаболизм вторичных мтаболитов, R - предсказана только общая функция [Источник].

Геномное окружение

С помощью программы COGNAT было получено следующее изображение геномного окружения с параметрами Neighborhood Size=9, Occurrence Threshold=5%, Taxonomy=No. При большем пороге никакие другие белки не выделялись цветом. PDF файл загружался, но не поддавался редактированию, поэтому пришлось сделать скриншот.

В целом, можно сказать, что геномное окружение выбранного КОГа не обладает высокой консервативностью. Однако почти все выделенные белки связаны с исследуемым КОГом. Например, COG4221 также является НАДФ-зависимым, а три нижних на схеме КОГа участвуют в переносе ацильной группы, которая также встречается в синтезе жирных кислот.

Отнесение белка экспресии/образования гидрогеназы из Salmonella enterica к терминам GO

Как видно из заголовка раздела, белок поменялся. Связано это с тем, что для короткоцепочечной дегидрогеназы максимальная идентичность с найденным с помощью BLAST белком составила 35%, что мне показалось недостаточным. Переделвать весь практикум с новым белком желания не было. Итак, идентификатор нового белка: AKF90774.1 - hydrogenase expression/formation protein.

С помощью AmiGO и BLAST был найден белок Hydrogenase 2 maturation protease (Accession: P37182). P-value составило 7,1*10-77, процент идентичности - 94%.

Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot P37182 (HYBD_ECOLI)

Аспект Идентификатор GO Название термина Перевод названия термина Код типа достоверности
Биологический процесс (Biological process) GO:0006464 Сellular protein modification process Процесс клеточной модификации белков IBA
Биологический процесс (Biological process) GO:0016485 Protein processing Посттрансляционная модификация белков IBA, ISS
Молекулярная функция (molecular function) GO:0004175 Endopeptidase activity Эндопептидазная активность IBA

Таблица 2. Описание кодов достоверности, использованных в Таблице 1.

Код типа достоверности Расшифровка кода типа достоверности Объяснение
IBA Inferred from Biological aspect of Ancestor Данный код достоверности означает, что данные о термине взяты из предкового гена на основании филогенетического анализа.
ISS Inferred from Sequence or structural Similarity Данный код достоверности означает, что данные о термине взяты из данных о другом белке на основании сходства последовательности или структуры. При этом анализ должен был проводиться вручную.

В Таблице 1 представлены аспекты, в которых участвует данный белок. Данные взяты из гомологии белков и, скорее всего, достоверны.