Учебная страница курса биоинформатики,
год поступления 2017
Занятие 6. Геномное окружение. База данных GO
Отчёт по занятию должен быть выложен на сайт, со ссылкой со страницы семестра, до 23:59 7 апреля (четверг) 2019 г.
1. Получение информации о КОГе, к которому относится ваш белок
- Используйте для работы белок, который был выдан вам для работы в 1 семестре (далее он будет называться "ваш белок");
- Определите КОГ, к которому он относится:
Откройте сервис CDD (Conserved Domain Database);
В поле поиска вставьте последовательность белка в FASTA-формате и нажмите клавишу Submit;
В правом верхнем углу выберите в поле View режим Full Results;
- В списке хитов найдите хиты, относящие Ваш белок к тому или иному КОГу;
С помощью последнего релиза базы данных посмотрите название данного КОГа и функциональную категорию, к которой он относится (скачивается файл, не пугайтесь).
Приведите на странице отчета следующие данные:
- Идентификатор КОГа;
Величину e-value для отнесения Вашего белка к данному КОГу (см. результаты CDD);
С какого по какой остаток вашего белка в нем обнаруживается КОГ (см. поле Interval в результатах CDD) и сколько всего в белке остатков;
- Название КОГа и функциональную категорию (или категории) на английском языке;
- Перевод названия КОГа и функциональной категории (категорий) на русский язык.
Обратите внимание! Если на одном и том же месте в белке обнаруживаются несколько КОГов, то вам нужно выбрать, к какому из них белок относится (как правило, это очевидно КОГ с наименьшим e-value). Не нужно приводить информацию по всем остальным КОГам или другим типам доменов.
2. Визуализация геномного окружения
Получите изображение геномного окружения для обнаруженного КОГа с помощью COGNAT. Приведите изображение(я) с подробной подписью (что изображено, какой программой получено, каковы параметры программы, что каким цветом покрашено и др.) на отчетной странице.
- Ответьте на вопросы:
Наблюдается ли в выданной вам группе белков консервативное геномное окружение? Если да, какие КОГи его образуют? Связаны ли они каким-то образом функционально (для ответа на этот вопрос может пригодиться использовать отнесение белков к терминам GO, см. задание 3)?
- Является ли геномное окружение консервативным во всех наблюдаемых случаях или есть вариабельность? Если есть, опишите, в чем она состоит.
3. Отнесение вашего белка к терминам GO
Важно! Если мера сходства вашего белка и белка из БД GO, с вашей точки зрения, недостаточна для того, чтобы переносить термины GO с одного на другой, возьмите другой белок или напишите мне письмо.
Пример подзаголовка для данного задания: "Отнесение белка <НАЗВАНИЕ ВАШЕГО БЕЛКА> из <ОРГАНИЗМ> к терминам GO"
С помощью инструмента AmiGO поиском BLAST обнаружьте в БД GO белок, который наиболее похож на ваш. Посмотрите выравнивание (BLAST match), сравните организм, к которому принадлежит находка, с организмом, к которому принадлежит Ваш белок. На страничке отчета укажите величину P-value для наилучшей находки и скажите, является ли найденный в БД GO белок тем же самым, что и Ваш (если нет - то оцените меру их сходства).
Перейдите на страничку белка-находки (view associations) и заполните Таблицу 1 в отчете. Чтобы узнать идентификатор Uniprot белка-находки, перейдите на вкладку Gene product information, и ищите слово Uniprot.
Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot P0ACJ8 (CRP_ECOLI) <вставьте идентификаторы белка-находки по принципу AC (ID)>
Аспект |
Идентификатор GO |
Название термина |
Перевод названия термина |
Код типа достоверности |
Биологический процесс (Biological process) |
GO:0000001 |
Unknown GO term |
Неизвестно что |
IEA |
... |
... |
... |
... |
... |
Для всех кодов типов достоверности, которые встречаются в вашей Таблице 1, заполните Таблицу 2 и приведите ее в отчете. Объяснение пишите, пожалуйста, своими словами, таким образом, чтобы на коллоквиуме вы смогли объяснить преподавателю, что означает данный код.
Таблица 2. Описание кодов достоверности, использованных в Таблице 1.
Код типа достоверности |
Расшифровка кода типа достоверности |
Объяснение |
IEA |
Inferred from Electronic Annotation |
Данный код присваивается в случае, когда... |
... |
... |
... |
Напишите абзац (или несколько) СВЯЗНОГО ТЕКСТА, объясняющего, что именно Вы сделали; в этом тексте должны вводиться таблицы 1 и 2, а также содержаться любая другая дополнительная информация, ваши выводы и т.п.
Подсказки и рекомендации
Подсказка по сервису COGNAT:
- Одна стрелочка = 1 ген. Показываются все гены, которые отнесены к выбранному КОГу в 711 прокариотических геномах (последний релиз базы данных, 2015 г.), и их геномное окружение.
- Щелчок по стрелочке ЛКМ показывает в правой части окна аннотацию к данному гену.
Neighborhood size – общее число генов, которые будут показаны, включая целевой ген (поровну слева и справа от целевого гена).
Occurence threshold – если ген, продукт которого относится к какому-то КОГу, встречается в большем % случаев на рисунке, то все находки данного КОГа будут покрашены. Например, 1% покрасит очень много стрелочек-генов, а 100%, скорее всего, вообще ни одной.
Taxonomy – по умолчанию (значение "НЕТ") геномные окружения будут отсортированы в соответствии с множественным выравниванием целевого КОГа (т.е. условно - по филогенетическому дереву данного КОГа). Значение "ДА" меняет сортировку на сортировку по таксономическому дереву организмов.
Download PDF – сохраняет рисунок в формате pdf. Проверьте, что браузер не блокирует всплывающие окна.