Четвертый семестр
Знакомство с терминологией GO
- Описание функции белка с помощью аннотации Gene Ontology
Описание функции белка THIM_BACSU в соответствии с GO-аннотацией
|
Онтология GO (название словаря) |
Количество разных ассоциированных терминов GO |
Функция белка |
Где? |
|
Ничего не нашлось |
|
Зачем, для чего? |
Biological process |
3 |
1)процесс биосинтеза тиамина - химические реакции и пути результатом которыхявляется синтез тиамина (витамина В1)(водорастворимый витамин представленый
свежих овощах, мясе и особенно в печени)
2)фосфорилирование - процесс введения фосфата в молекулу, резултатом чего является формирование фосфоэфирной связи, фосфорного ангидрида или афосфоамида |
Молекулярный механизм? |
Molecular function |
7 |
1)связывание нуклеотидов - селективное и нековалентное взаимодействие с нуклеотидами или с любым веществом, состоящим из нуклеозидов,
соеденных с ортофосфатом или олигофосфатом посредством гидроксильной группы рибозы или дезоксирибозы
2)гидрокситиазольная активность - катализ реакции: 5-(2-гидроксиэтил)-4-метилтиазол + ATФ = 4-метил-5-(2-фосфоэтил)-тиазол + AДФ + 2 H(+)
3)связывание АТФ - специфическое и нековалентное взаимодействие с АТФ (аденозин 5'-трифосфатом), являющимся универсальным и важным кофактором и
регулятором ферментов.
4)киназная активность - катализ реакции по переносу фосфатной группы, как правило с АТФ, на молекулу субстрата
5)трансферазная активность - катализ реакции переноса группы, например метильной, ацильной, фосфатной и других групп с одного соединения (донора)
на другое (акцептор)
6)связывание ионов металлов - специфическое и нековалентное взаимодействие с ионами металлов.
|
Специфичность? |
|
ничего не нашлось |
|
- Описание трёх терминов GO
Термины G, выбранные для описания:
- Биосинтез тиамина
- Гидрокситиазолкиназная активность
- Киназная активность
Описание терминов GO
GO ID выбранного термина |
Список синонимов |
Список ближайших родительских терминов GO с указанием типа связи |
Список ближайших дочерних терминов GO с указанием типа связи |
GO:0009228 |
процесс биосинтеза витамина B1
биосинтез витамина В1
биосинтез тиамина
анаболизм тиамина
синтез тиамина
формирование тиамина
процесс биосинтеза тиамина
|
Связь is a:
- GO:0042724 - биосинтез соединений, содержащих тиамин
- GO:0006772 - процессы метаболизма тиамина
|
- GO:0090180 - положительная регуляция биосинтеза тиамина
- GO:0070623 - регуляция процессов биосинтеза тиамина
- GO:0070624 - отрицательная регуляция процессов биосинтеза тиамина
|
GO:0004417 |
AТФ:4-метил-5-(2-гидроксиэтил)тиазол 2-фосфотрансферазная активность
гидрокситиазол киназа(фосфорилирование)
4-метил-5-(β-гидроксиэтил)тиазол киназная активность |
Связь is a:
- GO:0016301 - киназная активность
- GO:0016773 - фосфотрансферазная активность, гидроксильная группа - акцептор
|
нет |
GO:0016772 |
трансферазная активность, перенос фосфор-содержащей групп |
Связь part of:
- GO:0016310 - фосфорилирование
|
Связь is a
GO:0017050 D-erythro-sphingosine kinase activity
GO:0050515 4-(cytidine 5'-diphospho)-2-C-methyl-D-erythritol kinase activity
GO:0003951 NAD+ kinase activity
GO:0003991 acetylglutamate kinase activity
GO:0004020 adenylylsulfate kinase activity
GO:0004103 choline kinase activity
GO:0004111 creatine kinase activity
GO:0004140 dephospho-CoA kinase activity
GO:0004143 diacylglycerol kinase activity
GO:0004168 dolichol kinase activity
GO:0043868 N-acetylaminoadipate kinase activity
GO:0042736 NADH kinase activity
GO:0004305 ethanolamine kinase activity
GO:0004370 glycerol kinase activity
GO:0004371 glycerone kinase activity
GO:0004417 hydroxyethylthiazole kinase activity
GO:0004428 inositol or phosphatidylinositol kinase activity
GO:0004496 mevalonate kinase activity
GO:0009927 histidine phosphotransfer kinase activity
GO:0019200 carbohydrate kinase activity
GO:0019202 amino acid kinase activity
GO:0019205 nucleobase, nucleoside, nucleotide kinase activity
GO:0043744 N2-acetyl-L-aminoadipate kinase activity
GO:0043749 phenol, water dikinase activity
GO:0043752 adenosylcobinamide kinase activity
GO:0043798 glycerate 2-kinase activity
GO:0043841 (S)-lactate 2-kinase activity
GO:0008776 acetate kinase activity
GO:0008804 carbamate kinase activity
GO:0008819 cobinamide kinase activity
GO:0008887 glycerate kinase activity
GO:0008902 hydroxymethylpyrimidine kinase activity
GO:0008906 inosine kinase activity
GO:0008972 phosphomethylpyrimidine kinase activity
GO:0008974 phosphoribulokinase activity
GO:0008976 polyphosphate kinase activity
GO:0008980 propionate kinase activity
GO:0008986 pyruvate, water dikinase activity
GO:0004594 pantothenate kinase activity
GO:0004618 phosphoglycerate kinase activity
GO:0004631 phosphomevalonate kinase activity
GO:0004672 protein kinase activity
GO:0004743 pyruvate kinase activity
GO:0004756 selenide, water dikinase activity
GO:0004765 shikimate kinase activity
GO:0030387 fructosamine-3-kinase activity
GO:0008478 pyridoxal kinase activity
GO:0008531 riboflavin kinase activity
GO:0043843 ADP-specific glucokinase activity
GO:0043844 ADP-specific phosphofructokinase activity
GO:0050521 alpha-glucan, water dikinase activity
GO:0009024 tagatose-6-phosphate kinase activity
GO:0009029 tetraacyldisaccharide 4'-kinase activity
GO:0009030 thiamine-phosphate kinase activity
GO:0009038 undecaprenol kinase activity
GO:0018720 phenol kinase activity
GO:0019165 thiamine kinase activity
GO:0046316 gluconokinase activity
GO:0046522 S-methyl-5-thioribose kinase activity
GO:0047321 diphosphate-protein phosphotransferase activity
GO:0047324 phosphoenolpyruvate-glycerone phosphotransferase activity
GO:0047327 glycerol-3-phosphate-glucose phosphotransferase activity
GO:0001727 lipid kinase activity
GO:0047328 acyl-phosphate-hexose phosphotransferase activity
GO:0047329 phosphoramidate-hexose phosphotransferase activity
GO:0047330 polyphosphate-glucose phosphotransferase activity
GO:0047331 diphosphate-glycerol phosphotransferase activity
GO:0047332 diphosphate-serine phosphotransferase activity
GO:0047336 5-methyldeoxycytidine-5'-phosphate kinase activity
GO:0047506 (deoxy)adenylate kinase activity
GO:0047590 5-dehydro-2-deoxygluconokinase activity
GO:0047601 acetate kinase (diphosphate) activity
GO:0047620 acylglycerol kinase activity
GO:0047628 ADP-thymidine kinase activity
GO:0047633 agmatine kinase activity
GO:0047649 alkylglycerol kinase activity
GO:0047650 alkylglycerone kinase activity
GO:0047666 ammonia kinase activity
GO:0047667 AMP-thymidine kinase activity
GO:0047700 beta-glucoside kinase activity
GO:0047715 hypotaurocyamine kinase activity
GO:0047758 ATP:2-methylpropanoate phosphotransferase activity
GO:0047761 butyrate kinase activity
GO:0047814 D-arabinokinase activity
GO:0047841 dehydrogluconokinase activity
GO:0047878 erythritol kinase activity
GO:0047887 farnesyl diphosphate kinase activity
GO:0047900 formate kinase activity
GO:0047912 galacturonokinase activity
GO:0047931 glucosamine kinase activity
GO:0047933 glucose-1,6-bisphosphate synthase activity
GO:0047937 glucose-1-phosphate phosphodismutase activity
GO:0047940 glucuronokinase activity
GO:0047944 glutamate 1-kinase activity
GO:0047973 guanidinoacetate kinase activity
GO:0047976 hamamelose kinase activity
GO:0047992 hydroxylysine kinase activity
GO:0050059 lombricine kinase activity
GO:0050073 macrolide 2'-kinase activity
GO:0050154 opheline kinase activity
GO:0050165 pantetheine kinase activity
GO:0050190 phosphoglucokinase activity
GO:0050191 phosphoglycerate kinase (GTP) activity
GO:0050195 phosphoribokinase activity
GO:0050201 fucokinase activity
GO:0050225 pseudouridine kinase activity
GO:0050257 riboflavin phosphotransferase activity
GO:0050262 ribosylnicotinamide kinase activity
GO:0050276 scyllo-inosamine 4-kinase activity
GO:0050277 sedoheptulokinase activity
GO:0050316 T2-induced deoxynucleotide kinase activity
GO:0050317 tagatose kinase activity
GO:0050324 taurocyamine kinase activity
GO:0050331 thiamine-diphosphate kinase activity
GO:0050354 triokinase activity
GO:0050394 viomycin kinase activity
GO:0050400 xylitol kinase activity
GO:0034071 aminoglycoside phosphotransferase activity
GO:0010276 phytol kinase activity
GO:0071518 autoinducer-2 kinase activity
GO:0051752 phosphoglucan, water dikinase activity
Связь regulates
GO:0043549 regulation of kinase activity
GO:0019207 kinase regulator activity
Связь Positively regulates
GO:0019209 kinase activator activity
GO:0033674 positive regulation of kinase activity
Связь Negatively regulates:
GO:0019210 kinase inhibitor activity
GO:0033673 negative regulation of kinase activity
|
GO:0009228
GO:0004417
GO:0016772
Оценка качества функциональной аннотации белков в UniProt
- Определение реального и гипотетического числа белков из таксона Bos taurus
писание таксона:
Русское название - Корова
Английское название - Cow
Латинское название- Bos taurus
Taxonomy ID: 9913
Ранг - species (вид)
Поле ProteinExistence БД UniProt в SRS проиндексировано следующим образом:
1 - evidence at protein level (cуществование белка доказано экспериментально)
2 - evidence at transcript level (существование белка доказано на уровне соответствующих ему транскриптов)
3 - inferred from homology (предсказан по гомологии)
4 - predicted (предсказан другими способами)
5 - uncertain (существование белка не доказано)
Соотношение между реальными и гипотетическими белками из Bos taurus (по данным UniProt)
|
Количество в UniProt |
Количество в UniRef100 |
Существование белка доказано экспериментально |
1353 |
1363 |
Известны только соответствующие транскрипты |
11853 |
11670 |
Гипотетический белок, предсказан по гомологии |
885 |
949 |
Иные предсказанные гипотетические белки |
1605 |
1418 |
В UniProt и UniRef100 представлено практически одинаковое число белков каждой группы в ProteinExistence, при этом наибольшее число белков
предсказаны по транскриптам.
- Определение качества функциональной аннотации
Коды экспериментального доказательства функции:
EXP: Inferred from Experiment
IDA: Inferred from Direct Assay
IPI: Inferred from Physical Interaction
IMP: Inferred from Mutant Phenotype
IGI: Inferred from Genetic Interaction
IEP: Inferred from Expression Pattern
Был составлен запрос:
(((([uniprot-Species:Bos*] & [uniprot-Species:taurus*]) | [uniprot-Species:Bos taurus*]) & ((((([uniprot-ProteinExistence:1:*] & [uniprot-ProteinExistence:Evidence*]) & [uniprot-ProteinExistence:at*]) & [uniprot-ProteinExistence:protein*]) & [uniprot-ProteinExistence:level*]) | [uniprot-ProteinExistence:1: Evidence at protein level*])) & ((((([uniprot-DBxref_:EXP*] | [uniprot-DBxref_:IDA*]) | [uniprot-DBxref_:IPI*]) | [uniprot-DBxref_:IMP*]) | [uniprot-DBxref_:IGI*]) | [uniprot-DBxref_:IEP*]))
Последовательности найденных белков можно посмотреть в 1.fasta.
Использование GO для работы с моссовыми данными
- Описание протеома бактерии Caldicellulosiruptor bescii DSM 6725
- Число белков протеома: 2652 (В UniProt нашлось 2660)
- Число белков с хотя бы одной записью GO: 1663 (62,5 %)
- Диаграмма по типу словарей:
- Самые частые термины GO:
F: GO:0005524 (ATP binding)
C: GO:0005737 (cytoplasm)
F: GO:0003677 (DNA binding)
C: GO:0016021 (integral to membrane)
P: GO:0006355 (regulation of transcription, DNA-dependent)
P: GO:0055114 (oxidation-reduction process)
- Файл Excel со сводными таблицами
- Получение выборки последовательностей белков с заданной функцией
На сайте консорциума Gene Ontology был проведён поиск функции биосинтеза пиримидинов
среди всех терминов GO (всего 17 находок). Выбран идентификатор GO GO:0006221 (pyrimidine nucleotide biosynthetic process),
относящийся к словарю biological process.
В SRS-поиске был составлен запрос:
([uniprot-DBxref_:GO:0006221*] & (([uniprot-Species:Bos*] & [uniprot-Species:taurus*]) | [uniprot-Species:Bos taurus*]))
Найдено 2 белка из таксона Bos taurus с данной функцией. Результаты поиска
можно увидеть в файле uni.txt.
Определение главной функции в большом списке белков
С помощью GOstat определяем, белки с какой функцией
доминируют в списке P0A9G6.
P-value лучших находок не меньше 13 порядка:
GO ID |
Название (функция) |
Онтология |
P-value |
GO:0006097 |
glyoxylate cycle |
biological process |
3.96e-13 |
GO:0046487 |
glyoxylate metabolic process |
biological process |
6.25e-13 |
GO:0006081 |
cellular aldehyde metabolic process |
biological process |
3.89e-11 |
GO:0044248 |
cellular catabolic process |
biological process |
1.83e-06 |
GO:0006099 |
tricarboxylic acid cycle |
biological process |
2.04e-06 |
GO:0046356 |
acetyl-CoA catabolic process |
biological process |
2.04e-06 |
GO:0009109 |
coenzyme catabolic process |
biological process |
2.04e-06 |
GO:0051187 |
cofactor catabolic process |
biological process |
2.05e-06 |
GO:0006084 |
acetyl-CoA metabolic process |
biological process |
2.13e-06 |
GO:0009056 |
catabolic process |
biological process |
2.13e-06 |
GO:0044262 |
cellular carbohydrate metabolic process |
biological process |
1.44e-05 |
GO:0032787 |
monocarboxylic acid metabolic process |
biological process |
3.2e-05 |
GO:0019752 |
carboxylic acid metabolic process |
biological process |
4.33e-05 |
GO:0006082 |
organic acid metabolic process |
biological process |
4.37e-05 |
Как видно из таблицы, белки функционируют в цитоплазме и участвуют в метаболизме и катаболизме карбоновых кислот,
в частонсти, доминантные белки отвечают за катаболизм ацетил-CoA.
©Анисенко Андрей
|