8 (926) 907 94 08 |
Всё на свете является чудом! |
||||||||
Геномные браузеры |
|||||||||
---|---|---|---|---|---|---|---|---|---|
1.
EnsEMBL Первое, что сразу бросилось в глаза и запомнилось как приятное и полезное - это выделение трех организмов: человека, мыши и zebrafish (данио-рерио или брахиданио-рерио) - так как они одни из самых употребляемых. Переходим на страницу для человека. На ней содержится описание данных в этой версии сборки. Поищем заданный ген HLA-G сначала по названию. Получаем на страничке результатов таблицу с ссылками: При переходе по ссылке "Gene Human" нам выдается список находок, удовлетворяющих запросу 'HLA-G' у человека. Насколько я понял, в моем случае, все 7 находок удовлетворяли одному и тому же гену, но для него записи отличались. В каждой записи было свое расположение гена. Также мы получаем изображение хромосомы с выделенным регионом и изображение региона, на котором желтым цветом выделена искомая последовательность HLA-G. Если нажать на наш ген или любой другой, то появляется табличка с краткими данными о нем: Помимо того, на этом же изображении выделено разными цветами: гены, кодирующие белки- красным или желтым; псевдогены- серые; некодирующие гены- голубые; РНК-кодирующие гены- светло-фиолетовые. Кроме того оттенками синего выше размечены континги. Еще выше есть масштаб изображения - полоска с указанием - 1 Mb. Картинка ниже представляет данные о транскриптах с гена HLA-G. Также открывается вкладка с данными по этим транскриптам. В таблице приводятся имя транскрипта, его ID, длина, ID белка, длина белка, тип этого транскрипта и CCDS. CCDS - это кодирующая последовательность в наборе конценсусов кодирующей последовательности проаннотированная Ensembl, Vega, UCSC и NCBI. Это я вынес из глоссария EnsEMBL, расположенного в разделе "Help & Documentation". Причем в этой таблице можно добавлять и убирать отображаемые колонки. Если нажать на ссылки в ID белка, то появляется информация о белке: Такая же возможность есть и для транскрипта. Причем опять открывается отдельная вкладка в EnsEMBL, что очень удобно - позволяет всегда вернуться назад, не потеряв результата. Меню слева предоставляет много возможностей. Например, для транскрипта HLA-G-002 при нажатии на кнопку Supporting evidence (48) открывается изображение: Как я понял из объяснения, открывающегося при нажатии на кнопку "help" перед изображением: Ensembl/Havana транскрипты являются результатом выравнивания белка и сDNA (снова из глоссария: это ДНК, полученная обратной транскрипцией с мРНК, т.е это ДНК версия мРНК) последовательностей генома. И это изображение нам представляет как раз те самые сDNA и EST (Expressed Sequence Tags) и белки. Экзоны представлены красными прямоугольниками вверху. Данные Ensembl находятся в верхней половине, внизу на более темном фоне расположены данные Havana. Спускаемся ниже по меню: Exons (8). Появляется таблица с последовательностями экзонов и интронов и фланкирующих последовательностей для одного транскрипта - HLA-G-002. Причем последовательность написана в направлении 5' к 3' вне зависимости от того, на какой цепи находится ген. Очень удобно, что эту таблицу можно скачать. Экзоны на выравнивании выделены заглавными буквами: нетранслируемая область - фиолетовым цветом, кодирующая последовательность - черным. Интроны строчными голубыми буквами, фланкирующие последовательности строчными зелеными. При нажатии в меню на кнопку "General identifiers" (290) появляются внешние ссылки на другие банки данных (напр. UniProtKB/Swiss-Prot)для каждого белка приводится ID и выравнивание белка с транскриптом. Также просто на наши транскрипты в других банках. Далее полазив по этому меню, можно найти информацию о белках, их доменах, описаниях в Pfam. Вернемся к самой первой табличке с результатами. При переходе по ссылке Somatic mutation открываются записи с мутациями, ссылающимися на этот ген. Следующая графа Transcript вновь возвращает нас к всем транскриптам этого гена. При поиске по последовательности через BLAST/BLAT открывается изображение положения гена на кариотипе: А также расположение выравниваний относительно поданной на вход последовательности и таблица с соответствующими выравниванию ссылками: на выравнивания, участки генома, на описания структуры участка. Также можно изменять колонки таблицы. Пройдем по гиперссылке "Contig view", обозначенной маленькой буквой "C", и снова выходим на страницу, на которую попадали по первой ссылке из таблицы. 2. Другие геномные браузеры Vega В этом браузере геномы только человека, гориллы, мыши, кабана, собаки, кенгуру Валлаби, рыбы Danio rerio. В остальном же он несильно отличается от EnsEMBL, разве только содержит результаты ручного аннотирования HAVANA. При этом в отличие от EnsEMBL здесь меньше возможностей в левом меню. NCBI В нем также показывается где искомый ген располагается в хромосоме, в каком регионе. При этом со страницы результата поиска есть ссылки на само описание гена, на соответствующие ему континги, на запись белка, на выравнивание матричной РНК и искомой последовательности, на найденные экзоны, ссылку на выравнивания с гомологичными генами, на STS, CCDS. В целом можно найти все то, что было и в "Ансамбле", но с большими затратами сил, к тому же нет такой порой необходимой кнопочки HELP. UCSC Более скромное оформление, зато очень легко можно увеличивать до нужного размера нужную область. Сразу представлены изображения выравниваний гена с геном других организмов. SMRT Стоит отметить простой и удобный интерфейс, предоставляющий широкий спектр навигации и исследования результатов экспериментов. SMRT View также включает в себя поддержку виртуализации. Это первое приложение для визуализации данных, которое может визуализировать кинетику и структуру информации, это уникальная для SMRT технология. TIGR (JCVI) Тут стратегия - от инструмента, а не от генома. COG Не отметил ничего необычного ни в интерфейсе, ни в работе. |
Главная | ||||||||
Об авторе | |||||||||
Учебные семестры | |||||||||
Проекты автора | |||||||||
Друзья | |||||||||
Ссылки партнеров | |||||||||
Extra | |||||||||
Контакты | |||||||||
|
|||||||||
Mneff © 2011-2012 |