Четвертый семестр

Функции генов и их продуктов. Онтологии, GO.

  • Поиск нужного термина в словарях GO
  • Заданное описание локализации белка - хромосома.
    По слову chromosome найдено 91 термин.
    Терминов, отвечающих клеточной структуре - 38.
    Идентификатор - GO:0005694.
    Название онтологии — клеточный компонент (cellular component)
    Определение термина (в переводе на русский):
    Структура, состоящая из очень длинной молекулы ДНК и связанных с ней белков (например гистонов), которая несет наследственную информацию.

  • Описание функции белка P06710 (ДНК-полимеразы III) с помощью GOA
  •   Онтология GO (имя) Количество ассоциированных терминов GO Краткий ответ на вопрос
    Где? Клеточный компонент (component) 1 ДНК-полимераза III
    Зачем, для чего? Процесс (process) 1 (ссылок 2) репликация ДНК
    Молекулярный механизм? Функция (function) 7 (ссылок 12) Связывание нуклеотидов. ДНК-зависимая ДНК полимеразная активность. Связывание белков. Связывание АТФ. Трансферазная активность. Нуклеотидилтрансферазная активность. Нуклеозидтрифосфатазная активность.
    Специфичность?

  • Создание больших выборок белков с определенными функциями
    (поиск по идентификаторам GO в БД UniProt с помощью SRS)
  • Тренировка в поиске:

    1 запрос в SRS для того, чтобы получить сразу 3 документа P15650, P70618 и P51650: P15650|P70618|P51650
    Идентификаторы GO записаны в поле DBxref_.
    Нашли среди 3-х указанных белков
    1. митохондриальные белки: P15650, P51650
    2. ядерные белки: P70618
    3. все белки с низким качеством аннотации.

    Основное задание:

    Задача: оценить, насколько хорошо аннотированы в UniProt функции белки конкретной группы
    Протеом Mus musculus. Результаты поиска в UniProt, 20.03.2007 г.
      Количество записей Запрос
    Всего 65321 (([uniprot-Organism:Mus*] & [uniprot-Organism:musculus*]) | [uniprot-Organism:Mus musculus*])
    С идентификаторами всех 3-х онтологий GO 14357 ((([uniprot-Organism:Mus*] & [uniprot-Organism:musculus*]) | [uniprot-Organism:Mus musculus*]) & (([uniprot-DBxref_:C:*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:P:*]))
    В том числе в хромосоме 8 ((([uniprot-Organism:Mus*] & [uniprot-Organism:musculus*]) | [uniprot-Organism:Mus musculus*]) & ((([uniprot-DBxref_:C:*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:P:*]) & [uniprot-DBxref_:GO:0005694*]))
    В том числе только с самыми хорошими доказательствами функции (коды только IDA или TAS) 0 (((([uniprot-Organism:Mus*] & [uniprot-Organism:musculus*]) | [uniprot-Organism:Mus musculus*]) & ((([uniprot-DBxref_:GO:0005694*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:P:*]) & [uniprot-DBxref_:C:*])) & ((((((((((([uniprot-DBxref_:IDA:*] | [uniprot-DBxref_:TAS:*]) ! [uniprot-DBxref_:IMP*]) ! [uniprot-DBxref_:IGI*]) ! [uniprot-DBxref_:IPI*]) ! [uniprot-DBxref_:RCA*]) ! [uniprot-DBxref_:ISS*]) ! [uniprot-DBxref_:IEP*]) ! [uniprot-DBxref_:NAS*]) ! [uniprot-DBxref_:IEA*]) ! [uniprot-DBxref_:IC*]) ! [uniprot-DBxref_:ND*]))
    В том числе те, у которых встречается хотя бы один раз самое хорошее доказательство функции (коды только IDA или TAS) 0 (((([uniprot-Organism:Mus*] & [uniprot-Organism:musculus*]) | [uniprot-Organism:Mus musculus*]) & ((([uniprot-DBxref_:GO:0005694*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:P:*]) & [uniprot-DBxref_:C:*])) & ([uniprot-DBxref_:IDA:*] | [uniprot-DBxref_:TAS:*]))

     

    Таким образом, 22,4% записей, относящихся к Mus musculus имеют 3 идентификатора GO, то есть для них определены процесс, клеточный компонент и функция. Нет ни одной записи, у которой встречалось бы хоть один раз самое хорошее доказательство функции (коды только IDA или TAS) для белков, локализованных в хромосоме и имеющих три идентификатора GO.
    ©Лавыш Дарья