На страницу четвертого семестра


Функции генов и их продуктов. Онтологии, GO



  1. Поиск описания заданной локализации белка - "аппарат Гольджи" - в словарях GO
    На сайте консорциума GO мы производили поиск термина "аппарат Гольджи". В поле зароса мы ввели Golgi apparatus. В результате были выданы шесть результатов, среди которых наиболее соответствующим нашему запросу являлся этот, так как именно описывает клеточную органеллу. Среди результатов были те, которые описывали клеточный процессы, происходящие в аппарате Гольджи. Программа позволяет поставить фильтр на "cellular component" и не искать среди онтологий с названием "biological process", которые в данном случае нас не интересуют. Одна из ссылок называлась Golgi apparatus part, но понятие определяет любую составляющую часть аппарата Гольджи, поэтому этот результат также не соответствует нашему запросу.
    Итак:
    заданное описание локализации: аппарат Гольджи;
    выбранный термин GO и его идентификатор: Golgi apparatus, GO:0005794;
    название онтологии GO и его перевод на русский: cellular component (клеточный компонент);
    определение термина (в переводе на русский):
    Цитоплазматическая органелла эукариотических клеток, окруженная мембраной. Состоит из множества сплюснутых свободных от рибосом везикул. Аппарат Гольджи отличается от эндоплазматического реткулюма немного более толстыми мембранами, образующими характерный полукруг таким образом, что выпуклая сторона (cis-часть) примыкает к эндоплазматическому ретикулюму, а секреторные везикулы, появляются с вогнутой стороны (trans-часть). В отличие от клеток позвоночных, клетки беспозвоночных и растений содержат много таких органелл. Белки, подвергающиеся процессам модификации в аппарате Гольджи, образуются на рибосомах шероховатого эндоплазматического ретикулюма; в данной органелле происходят процессы модификации гликопротеинов, сортировки и упаковки белков в целях достаки их в различные места клетки. В данной органелле выделяют три участка согласно их структуре и функции: cis-, trans- и среднюю часть.

    В данном документе можно также увидеть "иерархию терминов", то есть как от более глобальных терминов можно прийти к нашему конкретному термину.

  2. Описание функции белка CARB_ECOLI с помощью базы данных GOA
    В базе данных Gene Ontology Annotation (GOA) Database мы искали описание функции большой цепи карбамоилфосфатсинтазы (AC P00968).

      Онтология (GO имя) Количество ассоциированных терминов GO Краткий ответ на вопрос
    Где? Информация должна была бы содержаться в "component", но в нашем случае здесь нет ни одной ссылки
    Мы посмотрели 19.04.07, информация появилась
    1 В цитоплазме
    Зачем, для чего? процесс (process) 6 (однако ссылок 9, то есть для одного и того же термина есть несколько документов с необходимой информацией) Участвует в синтезе аргинина и пиримидинов, обмене азотосодержащих веществ.
    Молекулярный механизм? функция (function) 7 (13) Катализируют АТФ-зависимую реакцию образования карбамоилфосфата, промежуточного продукта синтеза аргинина и пиримидинов, из L-глутамина в присутствии ионов HCO3-. Действует в комплексе с малой (глутаминовой) цепью карбамоилфосфатсинтазы. Амидотрансферазный домен малой цепи гидролизирует глутамин с образованием аммония через стадию образования промежуточного продукта, содержащего тиоэфирную связь. Аммоний мигрирует через внутреннюю часть белка, где взаимодействует с карбоксифосфатом. Карбоксифосфат образуется в результате фосфорилирования бикарбоната молекулой АТФ в сайте, находящемся в N-концевой части большой цепи карбамоилфосфатсинтазы. В результате взаимодействия карбоксифосфата с аммонием происходит образование карбамата. Данный интермедиат переносится к С-концевой части большой цепи карбамоилфосфатсинтазы, где фосфорилируется второй молекулой АТФ с образованием карбамоилфосфата.
    Специфичность? функция (function) 2 (8) Связывается с АТФ, ионами марганца, малой цепью карбамоилфосфатсинтазы (CARA_ECOLI)


    Все данные, кроме одного результата, были электоронной аннотации (IEA). Информация о том, что большая цепь карбамоилфосфатсинтазы образует комплекс с малой цепью (CARA_ECOLI) получено из опытов по физическому взаимодействию белков (IPI), здесь же приведена ссылка на статью из CiteExplore о белковых комплексах в Escherichia coli. Приведены ссылки на базы данных: UniProt/Swiss-Prot, InterPro, UniProt Enzyme Code (где был описан молекулярный механизм действия нашего белка), HAMAP (High-quality Automated and Manual Annotation of microbial Proteomes, где также есть описание механизма), UniProt Keyword.

  3. Создание больших выборок белков с определенными функциями (поиск по идентификаторам GO в БД UniProt с помощью SRS)
    Протеом Drosophila melanogaster. Результаты поиска в UniProt, 18.03.2007

      Количество записей Запрос
    Всего 28991 (([uniprot-Organism:Drosophila*] & [uniprot-Organism:melanogaster*]) | [uniprot-Organism:Drosophila melanogaster*])
    Всего белков аппарата Гольджи, имеющих хотя бы индетификатор "компонент" 110 ((([uniprot-Organism:Drosophila*] & [uniprot-Organism:melanogaster*]) | [uniprot-Organism:Drosophila melanogaster*]) & ((([uniprot-DBxref_:GO:*] & [uniprot-DBxref_:C:*]) & [uniprot-DBxref_:*Golgi*]) | [uniprot-DBxref_:GO: C: *Golgi*]))
    С идентификаторами GO 16591 ((([uniprot-Organism:Drosophila*] & [uniprot-Organism:melanogaster*]) | [uniprot-Organism:Drosophila melanogaster*]) & [uniprot-DBxref_:GO:*])
    С идентификаторами всех 3-х онтологий GO 4471 ((([uniprot-Organism:Drosophila*] & [uniprot-Organism:melanogaster*]) | [uniprot-Organism:Drosophila melanogaster*]) & (((([uniprot-DBxref_:GO:*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:P:*]) & [uniprot-DBxref_:C:*]) | [uniprot-DBxref_:GO: F: P: C:*]))
    В том числе в аппарате Гольджи 74 ((([uniprot-Organism:Drosophila*] & [uniprot-Organism:melanogaster*]) | [uniprot-Organism:Drosophila melanogaster*]) & ((((([uniprot-DBxref_:GO:*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:P:*]) & [uniprot-DBxref_:C:*]) & [uniprot-DBxref_:*Golgi*]) | [uniprot-DBxref_:GO: F: P: C: *Golgi*]))
    В том числе только с самыми хорошими доказательствами функции (коды только IDA или TAS) в аппарате Гольджи 2 (((([uniprot-Organism:Drosophila*] & [uniprot-Organism:melanogaster*]) | [uniprot-Organism:Drosophila melanogaster*]) & ((((([uniprot-DBxref_:GO:*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:P:*]) & [uniprot-DBxref_:C:*]) & [uniprot-DBxref_:*Golgi*]) | [uniprot-DBxref_:GO: F: P: C: *Golgi*])) & ((((((((((((([uniprot-DBxref_:IDA:*] | [uniprot-DBxref_:TAS:*]) ! [uniprot-DBxref_:IPI:*]) ! [uniprot-DBxref_:IMP:*]) ! [uniprot-DBxref_:IEP:*]) ! [uniprot-DBxref_:IGI:*]) ! [uniprot-DBxref_:RCA:*]) ! [uniprot-DBxref_:IGC:*]) ! [uniprot-DBxref_:NAS:*]) ! [uniprot-DBxref_:IC:*]) ! [uniprot-DBxref_:ND:*]) ! [uniprot-DBxref_:ISS:*]) ! [uniprot-DBxref_:IEA:*]) ! [uniprot-DBxref_:NR:*]))
    В том числе те, у которых встречается хотя бы один раз самое хорошее доказательство функции в аппарате Гольджи (коды только IDA или TAS) 54 (((([uniprot-Organism:Drosophila*] & [uniprot-Organism:melanogaster*]) | [uniprot-Organism:Drosophila melanogaster*]) & ([uniprot-DBxref_:IDA:*] | [uniprot-DBxref_:TAS:*])) & ((((([uniprot-DBxref_:GO:*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:P:*]) & [uniprot-DBxref_:C:*]) & [uniprot-DBxref_:*Golgi*]) | [uniprot-DBxref_:GO: F: P: C: *Golgi*]))
    Белки протеома, в которых встречаются коды только IDA или TAS 743 ((([uniprot-Organism:Drosophila*] & [uniprot-Organism:melanogaster*]) | [uniprot-Organism:Drosophila melanogaster*]) & (((((((((((([uniprot-DBxref_:IDA:*] | [uniprot-DBxref_:TAS:*]) ! [uniprot-DBxref_:IPI:*]) ! [uniprot-DBxref_:IMP:*]) ! [uniprot-DBxref_:IEP:*]) ! [uniprot-DBxref_:IGI:*]) ! [uniprot-DBxref_:RCA:*]) ! [uniprot-DBxref_:IGC:*]) ! [uniprot-DBxref_:NAS:*]) ! [uniprot-DBxref_:IC:*]) ! [uniprot-DBxref_:ISS:*]) ! [uniprot-DBxref_:IEA:*]) ! [uniprot-DBxref_:NR:*]))
    Белки протеома c ненадежными доказательствами: IGC, IC, ISS, IEA, NAS, IEP, NR 8849 ((([uniprot-Organism:Drosophila*] & [uniprot-Organism:melanogaster*]) | [uniprot-Organism:Drosophila melanogaster*]) & (((((((((((([uniprot-DBxref_:IEP:*] | [uniprot-DBxref_:IGC:*]) | [uniprot-DBxref_:NAS*]) | [uniprot-DBxref_:IC:*]) | [uniprot-DBxref_:ISS:*]) | [uniprot-DBxref_:IEA:*]) | [uniprot-DBxref_:NR:*]) ! [uniprot-DBxref_:IDA:*]) ! [uniprot-DBxref_:TAS:*]) ! [uniprot-DBxref_:IPI:*]) ! [uniprot-DBxref_:IMP:*]) ! [uniprot-DBxref_:IGI:*]) ! [uniprot-DBxref_:RCA:*]))


    Мы предватительно в документе UniProt посмотрели, где находится ссылка на GO. Это поле DR - чему соответствует DBxref (мы посмотрели в справках к названиям полей в Query form)
    Также мы определили (на примере белков P15650, P70618 и P51650), что P, F, C после GO - это процесс, функция и компонент.
    В базе данных UnoProt количество белков из организма Drosophila melanogaster довольно большое. Только 57% белков из них имеет какой-либо из идентфикаторов онтологий GO, и седьмая часть содержит индетификаторы всех трех онтологий GO.
    Если говорить об белках аппарата Гольджи, то здесь результаты несколько хуже. Всего аннотировано 110 белков аппарата Гольджи (здесь поиск производился на основании того, что есть хотя бы идентификатор "компонент"). 74 белка содержат все идентификаторы GO. И только два из них имеют хорошие коды IDA или TAS. К тому же, один из двух белков - Q3YNC8_DROME и вовсе является фрагментом. Таким образом, белки аппарата Гольджи изучены не очень хорошо.
    Также мы посмотрели, сколько в целом белков у Drosophila melanogaster с ненадежными доказательствами: IGC, IC, ISS, IEA, NAS, IEP, NR. Их оказалось 8849, то есть более, чем третья часть белков данного организма в UnoProt. Белков, функции которых были определены прямыми исследованиями (IDA или TAS), только 743, то есть тридцать девятая часть всех белков тз этого организма. Из этого следует, что при изучении функций белков компьютерные методы более часто используются, чем прямые исследования, так как обеспечивают более быстрое получение результата, хотя, наверное, в ущерб надежности полученных данных.



©Шахбатян Римма Рубеновна