Занятие 5. Gene Ontology

Срок выполнения заданий — утро 20 марта 2012 г.

  1. Опишите функцию "своего" белка с помощью аннотации Gene Ontology
  2. Вспомните или найдите AC своего белка. Перейдите на страницу QuickGO на сайте EBI. Скопируйте AC в окошко для поиска и нажмите "Search", затем пройдите по гиперссылке. Рассмотрите открывшуюся таблицу, найдите гиперссылки на странички с описанием терминов. Опишите функцию белка в таблице, шаблон см. ниже.

    Описание функции белка XXXX_BACSU в соответствии с GO-аннотацией

      Онтология GO (название словаря) Количество разных ассоциированных терминов GO Функция белка
    (краткое описание, близкое к тексту определения термина(ов) GO
    Где?      
    Зачем, для чего?      
    Молекулярный механизм?      
    Специфичность?      

  3. Опишите 3 термина GO, ассоциированных с вашим белком
  4. Выберите 3 наиболее содержатальных, на ваш взгляд, термина GO, ассоциированных с изучаемым белком, по одному термину из каждого словаря GO. Проведите поиск описаний выбранных терминов на главном сайте консорциума Gene Ontology. Для каждого определите, есть ли точные синонимы, какие термины являются родительскими, а какие – дочерними, определите типы связей между ними, запишите их в табличку, см. ниже.

    Вставьте в отчёт три изображения графов родительских терминов.

    Описание терминов GO

    GO ID выбранного термина Список синонимов Список ближайших родительских терминов GO с указанием типа связи Список ближайших дочерних терминов GO с указанием типа связи
           
           
           

  5. Опишите протеом бактерии, полный геном которой секвенирован и аннотирован, используя термины GO. Бактерию выберите самостоятельно.
  6. В отчёте укажите:

    Указания. Запишите число белков в протеоме выбранной бактерии (по ссылкам со страницы бактерий → proteoms → genome statistics).
    Используйте SRS для поиска в банке UniProtKB.
    Проверьте, что запрос по имени организма выдает правильное число записей белков (по крайней мере, расхождение невелико).
    Зайдите в расширенную форму запроса (Extended query form). Особенность запросов с помощью этой формы состоит в том, что на одну запись белка выдается несколько отдельных результатов. Так, запрос по базе данных GO выдаст по отдельность все ссылки на GO из каждой записи, где они есть.

    Запрос следует составить так.
    В поле organism name укажите навание бактерии.
    Найдите блок про связи с другими базами данных (Link subentry fields).
    В поле DBname укажите имя базы данных - GO, в поле DBxref не указывайте ничего, так как вас интересуют все ссылки.
    Получив результат, нажмите Save, отметьте что положено, save with view: complete entries и полученный файл импортируйте в Excel.

    Как преобразовать все в Excel.

    Вместо Excel можно (и приветствуется!) написать программу на Python'е.

    Получите ответы на вопросы и опишите всё в отчёте.

  7. Получение выборки последовательностей белков с заданной функцией
  8. В таблице указан таксон живого мира и некоторая биологическая функция белков. Ваша задача — создать выборку белков из данного таксона с данной функцией.

    Этапы работы: