На первую страницу четвертого семестра

Функции генов и их продуктов. Онтологии, GO

Поиск одного из ключевых слов, соответствующих белку DXR_ECOLI, среди терминов GO.

Создание выборок белков с определенными функциями (поиск по идентификаторам GO в БД UniProt с помощью SRS)

Моя задача заключается в том, чтобы исследовать качество аннотации функции у конкретной группы белков, расположенных в ядре у организма Danio rerio. Отчет представлен в виде таблицы:
Количество белков Запрос в SRS
Всего 14676 (([uniprot-Organism:Danio*] & [uniprot-Organism:rerio*]) | [uniprot-Organism:Danio rerio*])
С идентификаторами всех трех онтологий GO 3698 "((([uniprot-Organism:Danio*] & [uniprot-Organism:rerio*]) | [uniprot-Organism:Danio rerio*]) & ((([uniprot-DBxref:C:*] & [uniprot-DBxref:P:*]) & [uniprot-DBxref:F:*]) > parent )) "
В этом же числе локализованных в ядре 1188 "((([uniprot-Organism:Danio*] & [uniprot-Organism:rerio*]) | [uniprot-Organism:Danio rerio*]) & ((([uniprot-DBxref:C:nucleus*] & [uniprot-DBxref:P:*]) & [uniprot-DBxref:F:*]) > parent )) "
Только с самыми хорошими доказательствами функции(TAS/IDA) 2 "(((([uniprot-Organism:Danio*] & [uniprot-Organism:rerio*]) | [uniprot-Organism:Danio rerio*]) & ((([uniprot-DBxref:C:nucleus*] & [uniprot-DBxref:P:*]) & [uniprot-DBxref:F:*]) > parent )) & ((([uniprot-DBxref:TAS.*] | [uniprot-DBxref:IDA.*]) ! (((((([uniprot-DBxref:IMP.*] | [uniprot-DBxref:IGI.*]) | [uniprot-DBxref:IPI.*]) | [uniprot-DBxref:ISS.*]) | [uniprot-DBxref:IEP.*]) | [uniprot-DBxref:NAS.*]) | [uniprot-DBxref:IEA.*])) > parent )) "
Только с самыми плохими доказательствами функции (IEA) 1149 "(((([uniprot-Organism:Danio*] & [uniprot-Organism:rerio*]) | [uniprot-Organism:Danio rerio*]) & ((([uniprot-DBxref:C:nucleus*] & [uniprot-DBxref:P:*]) & [uniprot-DBxref:F:*]) > parent )) & (([uniprot-DBxref:IEA.*] ! ((((((([uniprot-DBxref:IMP.*] | [uniprot-DBxref:IGI.*]) | [uniprot-DBxref:IPI.*]) | [uniprot-DBxref:ISS.*]) | [uniprot-DBxref:IEP.*]) | [uniprot-DBxref:NAS.*]) | [uniprot-DBxref:TAS.*]) | [uniprot-DBxref:IDA.*])) > parent )) "

При выполнении этого задания я руководствовалась общепринятой иерархией кодов доказательств. Согласно ей наличие самых плохих доказательств соответствует коду IEA (они взяты из базы данных без проверки куратором), а самых хороших доказательств соответствует коду TAS/IDA (прошли экспериментальную проверку). У локализованных в ядре белков Danio rerio, аннотированных в GO, присутствовал код TAS/IDA. Можно сделать вывод, что данная группа белков описана достаточно точно. Результаты вполне логичны и обоснованы: хороших мало(2) плохих соответственно много. Почти все белки (за исключением тех двух, не влияющих на общую картину),имеющиеся в геноме Danio rerio имеют плохую аннотацию, те еще не очень хорошо и тщательно изучены

Изображение Danio rerio (Zebra fish):