Учебная страница курса биоинформатики,
год поступления 2014
Занятие 7
Отчет по заданиям должен быть выложен на сайт к 6 апреля.
Для правильного выполнения заданий используйте подсказки. В случае трудностей (вообще или с выданным геном) пишите на anastasia.v.stolyarova@gmail.com
Помимо ответов на вопросы, приветствуются самостоятельные выводы.
1. Геномное окружение, SEED
Цель задания: проверить консервативность геномного окружения заданного гена.
Найдите данный ген (или гомологичный из близкородственного организма) в базе данных SEED. Если использовали гомолог, укажите в отчете его e-value по поиску BLAST-ом, и какому организму он принадлежит.
Перейдите на страницу гена. В графическом окне с помощью вкладки “Advanced” получите изображение окрестности данного гена и около 10 его ортологов. Ваша задача - найти консервативное окружение данного гена, то есть такие группы ортологов, которые лежат в окрестности этого гена даже в достаточно далеких организмах (см. подсказки). Картинку вставьте в отчет.
Опишите полученные результаты:
- Какие гены появляются в окрестности данного гена во многих геномах (название, номер на картинке из SEED)?
- Присутствуют ли эти гены в окрестности всех ортологов?
- Если нет, что объединяет эти организмы (филогения, патогенные / непатогенные, грамположительные или грамотрицательные, ...)
2. Опероны, DOOR
Цель задания: найти гены, входящие в один оперон с заданным, и сравнить находки с результатами из SEED
На сайте DOOR найдите оперон, в которых входит заданный ген.
- Приведите в отчете изображение оперона, его номер, названия входящих в него генов и белков, которые они кодируют.
- Нашлись ли эти гены с помощью SEED? Входят ли те же гены в опероны других организмов (прежде всего, найденных с помощью SEED)?
3. Метаболические пути, KEGG
Цель задания: выяснить, связаны ли найденные белки с заданным функционально
- Найдите белок, кодируемый данным геном, в KEGG. Перейдите на страницу метаболического пути, в который он входит.
Опишите результаты:
- Входят ли в этот метаболический путь белки из найденного оперона или найденные SEEDом?
- Какова их функция, связана ли она с функцией заданного белка? Как это объяснить?
Приведите в отчёте итоговую таблицу, в которой указаны:
- Идентификатор (из таблицы)
- Название гена (напр. ndhC, tolC и т. д.)
- Организм (если использовался близкородственный, укажите это)
- Функция белка
- Система KEGG, в которую он входит
- Номер оперона
- Белки, кодируемые в том же опероне
- Белки, найденные через геномное окружение
Обратите внимание, что один и тот же белок может называться по-разному!
Отметьте (полужирным, подчёркиванием или цветом) белки, принадлежащие тому же метаболическому пути и белки, найденные и через SEED, и через DOOR. В подписи в таблице расшифруйте эти обозначения.