Обзор протеомов

1. Выбор протеомов

В предыдущем практикуме я использовала белок организма Natrinema halophilum. В UniProt Proteomes по запросу (taxonomy_id:88723) были найдены протеомы, причем среди рефефренсных присуствовал и протеом данного организма. Natrinema halophilum - галофильная архея, обитающая в соленых водоемах.

Для сравнения я выбрала референсный геном протеом относительного близкого организма из того же порядка (Halobacteriales) Halovenus carboxidivorans Отличительный признак, неободимый для сравнения, здесь - специфичность окисляемого субстрата. В частности, организм Halovenus carboxidivorans способен окислять монооксид углерода.

Для Natrinema halophilum точной информации по такому признаку я не нашала, однако в статье, описывающей выделение данного вида арехей зафиксирован состав химического состава как самих арехей так и окружающей их среды. По этим признакам в том числе было принято решение отнести архею к этому роду. А для рода Natrinema не характрено наличие такого типа метаболизма.

2. Описание протеомов

Для скачивания протемов Natrinema halophilum и Halovenus carboxidivorans были использованы команды:wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000509241)' -O UP000509241.swiss.gz. и wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000466535)' -O UP000466535.swiss.gz.

Протеом Natrinema halophilum имеет ID UP000509241. Значение CPD для данного проетеома Standard, это означает, что размер протеома очень близок к среднему по близким организмам таксона. По оценке BUSCO C:99% (S:98.7% D:0.3%) F:0.1% M:1%. Размер протеома 3,981 записей.

Протеом Halovenus carboxidivorans имеет ID UP000466535. Значение CPD для данного проетеома Close to standard (low value), это означает, что размер и организация протеома меньше, чем среднее по таксону. По оценке BUSCO C:97.3% (S:96.5% D:0.9%) F:0.1% M:2.5%. Размер протеома 3,185 записей.

Таким образом, выбранные протеомы довольно изучены и пригодны для дальнейшего описания и сравнения.

3. Команды для описания

При поиске данной структуры я заметила, что ферменты с аналогчиным названием у организмов группы Euryarcheota, то есть группы в которую входит обозреваемый организм, могут иметь имя гена, не совпадающее с именем в описываемой мной записи. По моему мнению такого быть не должно, учитывая высокую консервативность описываемого фермента. Чтобы понять почему так произошло, я использовала команду поиска (protein_name:"DNA-directed RNA polymerase subunit beta") AND (taxonomy_id:88723) NOT (gene:rpoB) (здесь группа Natrinema была выбрана для сужения группы поиска и соответсвенно разброса). По этому запросу было найдено 12 записей, однако при их подробном изучении стало понятно, что название гена для них просто не аннотировано, а критерием поиска по сути стали названия ORF, которые, конечно, не совпадают с названием гена.

Далее, учитывая на информацию о регулятроной функции данной субъединицы, я решила выяснить связывается ли данная субъединица с ДНК напрямую или лишь опосредованно, через прочие субъединицы комплекса полимеразы. По данным UniProt, субъединица является ДНК-связывающей, однако, стоит учесть что данная характеристика была дана при автоматической аннотации. В попытках проверить истинность данной информации я решила поискать информацию о данной субъединице у организмов близких к описываемому, но уже с аннотацией, основывающейся на действительно выделенный белок. Однако, даже при поиске таковых среди большой группы Euryarcheota: (protein_name:"DNA-directed RNA polymerase subunit beta") AND (taxonomy_id:28890) AND (existence:1), подходящие данные найти не удалось.

В аннотации к белку указано, что у него присутствует ион цинка в роли кофактра. Я решила посмотреть рапространенность данного явления среди ферментов данного класса внутри группы Euryarcheota. Для этого я использовала запрос " (EC:2.7.7.6)" AND (cc_cofactor_chebi:"CHEBI:29105") AND (taxonomy_id:28890). По нему было найдено более 4.5 тысяч записей, что указывает на высокую частоты данного явления у архей.