Genome Browsers

EnsEMBL

Портал EnsEMBL предназначен для визуализации известной информации о геномах человека и животных.

Для начала поищем информацию о гене человека FLOT1 из записи BA000025.embl. Для этого воспользуемся поиском по человеческому геному сервисом BLAST/BLAT:

Поищем для начала участок гена - экзон с координатами 1200313-1200388 (экзон номер 3). Будем искать по кодирующей последовательности в человеческом геноме точные совпадения.

Нашлось одно выравнивание. В разделе Alignment Locations vs. Karyotype на странице результатов графически показано расположение участка генома, который выровнялся с исходной последовательностью (в данном случае это малое плечо шестой хромосомы):

В разделе Alignment Locations vs. Query так же в графическом виде приведена информация о полученном выравнивании (HSP - это high-scoring segment pair):

В разделе Alignment Summary приведена таблица находок, где указана информация о выравнивании (есть фильтр отображения столбцов).

В первом столбце таблицы Links есть три ссылки:

  • на выравнивание ([A] - Alignment), где можно увидеть само выравнивание и раную информацию о нем. В данном случае: вес выравнивания 386, E-value 7.2e-60, длина выравнивания 76, процент совпадений 100.00%, направление последовательности запроса относительно записи в базе данных обратное.

  • на последовательность ([G] - Genome Sequence) выровненного с запросом участка генома, где можно посмотреть фланкирующие последовательности находки, самостоятельно задавая их длину.

  • на участок человеческого генома ([C] - ContigView), где есть возможность интерактивной работы с участком хромосомы, информация о генах на нем, о кодирующих участках и интронах:

    Можно искать ген по его названию (мой - FLOT1). Для этого можно на домашней странице EnsEMBL ввести название гена в поисковую форму:

    Для моего гена FLOT1 нашлось 9 генов, 4 соматические мутации и 58 транскриптов в геноме человека.

    В разделе Help&Documentation есть некоторые инструкции и "обучалки" (tutorials) по сайту.

    В разделе Downloads есть базы данных различного формата, которые можно загрузить. При можно скачать участки последовательностей ДНК, протеома и т.п. различных животных.

    UCSC Genome Browser

    Геномный браузер UCSC содержит базу последовательностей и рабочие инструменты для большого количества геномов. Как сказано на главное странице, геномный браузер UCSC позволяет перемещаться по хромосомам, показывая все существующие к ним аннотации. Есть Gene Sorter, который отображает сортируемую таблицу генов, которые каким-либо образом родственны или гомологичны. The Table Browser можно использовать для поиска данных, связанных с запросом, в текстовом формате, для подсчета пересечений между запросами и поиска последовательности ДНК, покрываемой запросом.

    VisiGene - виртуальный микроскоп, позволяющий просматривать большую коллекцию изображений мышей и лягушек in situ. Эти изображения показывают, где конкретный ген используется в огранизме иногда даже до клеточного уровня. Я попробовала ввести в строку поиска flot1 - название моего гена. Нашлось одно изображение:

    В легенде под изображением можно найти информацию об источнике, год, авторов и т.п. Из интресного: это изображение саггитального среза мозга мышки-самца на шестой неделе развития.

    Здесь также есть BLAT для поиска и картирования последовательностей в геноме. Поищем тот же экзон гена FLOT1.

    Нашлось несколько находок в шестой хромосоме, отличающиеся только координатами. Заметим, что координаты последней находки совпадают с координатами находки в браузере EnsEMBL. Поэтому будем работать дальше с ней. Рядом с названием записи запроса есть две ссылки browser и details.

    Перейдя по первой (browser) мы увидим графическое изображение запроса выровненное с возможными транскриптами - mRNA и ESTs человека. Темные прямоугольники - экзоны, стрелочки - интроны, которые также показывают направление последовательности.

    Геномный браузер UCSC позволяет анализировать и изучать альтернативный сплайсинг генов.

    Эта картинка из задания по предсказанию генов (следущий практикум), на ней отмечены рамочками примеры возможного альтернативного сплайсинга (красная и фиолетовая - кассетные экзоны, зеленая рамка — случай альтернативного донорного сайта, синяя рамка возможный удержанный интрон).

    Кстати, приятно, что здесь запоминаются настройки отображения с последнего раза, которые можно выбрать в такой хорошем раскрывающемся меню:

    Таким образом, интерфейс геномного браузера UCSC позволяет измененять отображаемую информацию в соответствии с целью ее использования.

    Если сравнивать геномный браузер UCSC с EnsEMBL, то мне сложно это сделать, так как я не так уж много там поработала (по одному разу последовательноти прогнав-то). Для таких элементарных операций не составило большого труда разобраться, что где и куда нажимать.



Наверх