Геномное окружение. База данных GO
Получение информации о КОГе
Для выполнения данного практикума использовался белок с идентификатором ALX10644.1 - короткоцепочечная дегидрогеназа из Burkholderia cepacia JBK9.
С помощью CDD было обнаружено, что белок относится к КОГу с названием FabG (какое совпадение с предыдущим практикумом!) и имеет код COG1028 с e-value 5.53*10-22. КОГ обнаруживается с 1 по 191 остатки. Всего в белке 225 аминокислотных остатков. Название и семейство КОГа на английском: NAD(P)-dependent dehydrogenase, short-chain alcohol dehydrogenase family. Перевод: НАДФ-зависимая дегидрогеназа, семейство короткоцепочечных алкоголь-дегидрогеназ. Функциональная категория имеет код IQR: I - транспорт и метаболизм липидов, Q - биосинтез, транспорт и катаболизм вторичных мтаболитов, R - предсказана только общая функция [Источник].
Геномное окружение
С помощью программы COGNAT было получено следующее изображение геномного окружения с параметрами Neighborhood Size=9, Occurrence Threshold=5%, Taxonomy=No. При большем пороге никакие другие белки не выделялись цветом. PDF файл загружался, но не поддавался редактированию, поэтому пришлось сделать скриншот.
В целом, можно сказать, что геномное окружение выбранного КОГа не обладает высокой консервативностью. Однако почти все выделенные белки связаны с исследуемым КОГом. Например, COG4221 также является НАДФ-зависимым, а три нижних на схеме КОГа участвуют в переносе ацильной группы, которая также встречается в синтезе жирных кислот.
Отнесение белка экспресии/образования гидрогеназы из Salmonella enterica к терминам GO
Как видно из заголовка раздела, белок поменялся. Связано это с тем, что для короткоцепочечной дегидрогеназы максимальная идентичность с найденным с помощью BLAST белком составила 35%, что мне показалось недостаточным. Переделвать весь практикум с новым белком желания не было. Итак, идентификатор нового белка: AKF90774.1 - hydrogenase expression/formation protein.
С помощью AmiGO и BLAST был найден белок Hydrogenase 2 maturation protease (Accession: P37182). P-value составило 7,1*10-77, процент идентичности - 94%.
Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot P37182 (HYBD_ECOLI)
Аспект | Идентификатор GO | Название термина | Перевод названия термина | Код типа достоверности |
Биологический процесс (Biological process) | GO:0006464 | Сellular protein modification process | Процесс клеточной модификации белков | IBA |
Биологический процесс (Biological process) | GO:0016485 | Protein processing | Посттрансляционная модификация белков | IBA, ISS |
Молекулярная функция (molecular function) | GO:0004175 | Endopeptidase activity | Эндопептидазная активность | IBA |
Таблица 2. Описание кодов достоверности, использованных в Таблице 1.
Код типа достоверности | Расшифровка кода типа достоверности | Объяснение |
IBA | Inferred from Biological aspect of Ancestor | Данный код достоверности означает, что данные о термине взяты из предкового гена на основании филогенетического анализа. |
ISS | Inferred from Sequence or structural Similarity | Данный код достоверности означает, что данные о термине взяты из данных о другом белке на основании сходства последовательности или структуры. При этом анализ должен был проводиться вручную. |
В Таблице 1 представлены аспекты, в которых участвует данный белок. Данные взяты из гомологии белков и, скорее всего, достоверны.