Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2018

Практикум 10. Геномные браузеры

Ссылки: UCSC genome browser, Ensembl, NCBI Genome Data Viewer

Перенес мягкий (но не жесткий!) дедлайн по практикуму на неделю из-за небольшой правки задания.

— ИР

1. UCSC

Прошу прощения, немного подправил задания, некоторые моменты выясняются только при проверке работ.

Теперь вместо полного имени гена (которое для некоторых генов найти оказалось нетривиально) нужно привести Gencode ID гена (не транскрипта, начинается на ENSG, а не на ENST).

Координаты гена надо отдельно указать для каждого альтернативного транскрипта (но не больше, чем для трёх). Для них же надо указать и Transcript ID в Gencode.

Еще пара комментариев:

1) Количество альтернативных продуктов (имеются в виду РНК продукты, белки могут не различаться) – это количество полосочек в треке Gencode при full-отображении.

2) Длину белка можно узнать в разделе "Sequence and Links" на странице транскрипта.

— ИР

Выберите какой-нибудь белок человека и найдите информацию о гене этого белка в геномном браузере UCSC.

  1. В отчете приведите:
    • имя гена (короткое),
    • идентификатор гена в Gencode,

    • на какой цепи он закодирован,
    • в какой хромосоме находится,
    • к каким плечу и полосе принадлежит участок (например, chr7:p14.2, здесь chr7:p – короткое плечо хромосомы 7, 14.2 – номер полосы в этом плече),

    • сколько альтернативных продуктов (транскриптов) закодировано в гене,
    • для каждого транскрипта укажите идентификатор Gencode, координаты в хромосоме (включая UTR'ы), число экзонов (общее) и длину последовательности белка (если транскриптов больше трёх, то описать нужно только три первых).
      Всю информацию берите из аннотации GENCODE (самой верхней).

  2. Сохраните картинку окрестности гена из Genome Browser c треками:
    • транскрипты GENCODE и RefSeq,

    • консервативность последовательности среди позвоночных (Conservation),
    • частые полиморфизмы (Common SNPs) последней версии (151).
      Все остальные треки скройте.

Указания.

UCSC genome browser и NCBI Genome Data Viewer (Ensembl вроде бы нет) используют "всплывающие окна" (pop-up windows) для сохранения картинок. Но уважающие себя современные браузеры их с удовольствием блокируют. Конкретно этим сайтам Вы можете доверять, поэтому стоит разрешить всплывающие окна для них. В противном (во всех смыслах) случае придется скриншотить треки для вставки в отчет. Как разрешить всплывающие окна в вашем браузере, ищите в интернете.

2. Ensembl

Постройте и сохраните на kodomo выравнивание выбранного гена человека с гомологичным геном шимпанзе, оцените процент различий на 100 нуклеотидов. Сравните с информацией из интернета) В отчете должно быть краткое описание работы, ссылка на выравание, процент отличий человека и шимпанзе в выбранном гене и сравнение с полногеномной оценкой (нужно указать источник).

Указания. Найдите заданный ген в поиске Ensembl. В меню слева выберите Comparative Genomics → Genomic alignments. Нажмите Select another alignment, введите название организма – Chimpanzee → Apply. Сохраните полученное выравнивание (Download). Подсчитать число различий можно командой infoalign пакета EMBOSS (сами разберетесь как).

3*. Genome Data Viewer

Рассмотрите тот же фрагмент генома в Genome Data Viewer. Опишите, в чем отличие от других браузеров, в чем он удобнее/неудобнее, какую информацию можно извлечь только из этого браузера.

Подсказка: В Ensembl найдите слева ссылку на NCBI, где сразу откроется Genome Data Viewer c тем же фрагментом генома.