|
Блок 2: последовательности нуклеиновых кислот. Практика 4: Геномные браузеры.
Задание 1. EnsEMBL.
Портал EnsEMBL – совместный проект EMBL – EBI и Sanger Centre с целью создания программной системы для автоматической аннотации эукариотических геномов.
Мне понравилась структура портала - user-friendly и интуитивно понятная. Для удобства ознакомления с сайтом есть даже специальный раздел "Интерактивного обучения", который содержит ознакомительные и обучающие презентации, учебники и ролики.
Примечательно, что совершенно бесплатно :) на портале доступны: поиск ДНК из человеческого генома, обзор хромосом, поиск белков и белковых семейств.
Как заявляется разработчиками проекта, Ensembl стремится соответствовать следующим критериям:
- точный, автоматический анализ данных генома;
- анализ и аннотациии основаны на текущих, своевременно обновляемых данных;
- доступность полученных данных для всех через сеть Интернет;
- предоставление данным другим лабораториям по биоинформатике.
Основной акцент в базе данных Ensembl сделан на позвоночных геномах, но другие группы адаптировали систему для использования с растительными и грибковыми геномами.
Пользователь портала может указать тип генома, хромосому, диапазон в ней. В результате будет показана информация об элементах генома в данной части, а также вокруг нее.
На рисунке покажем поле ввода интересующего участка:

а ниже - результат работы сервиса:

Щелкнув мышью по интересующим элементам, получим информацию о них:

Например, можно уточнить место, где расположена интересующая нас последовательность (красный столбик с осевой линией), гаплотипные, то есть совместно наследующиеся участки хромосом (красным):

И еще для детального изучения доступна картина с информацией о самой хромосоме и составляющих ее контигах:

С помощью цвета условных обозначений, видим rotein coding - участки, кодирующие белки, псевдогены (на нашем примере не встречается) и т.д.
Благодаря сервису, можно получить информацию о локусах, генах и повторах, содержащихся в выбранной области. Но нет, скажем, сведений о кодирующих и некодирующих участках - экзонах и интронах.
Еще одно замечание: представление результатов в графическом виде. Для небольших запросов это наглядно, но при масштабных запросах нужен вывод для автоматизированной обработки результатов.
Задание 2. Другие геномные браузеры.
В качестве примеров можно взять:
- браузер UCSC Table Browser, genome.ucsc.edu
Сразу отмечаем аскетичность интерфейса и некую "старомодность" макета сайта. Но ресурс предоставляет доступ к огромному количеству данных о геномах различных организмов. Можно указать геном, хромосому, интересующий диапазон, а также тип информации на выходе.
К недостаткам, несомненно, относится огромное количество настроек, которые нужно задать (пример использования Table Browser для получения информации о генах, пересекающихся с участком 22-й хромосомы генома человека, начиная с 33265750 и до 33266750 позиции:
Нельзя задать несколько интересующих таблиц, формат выводимого результата.
- браузер OMIM (On-line Mendelian Inheritance in Man), www.ncbi.nlm.nih.gov/omim
Крупнейшая база данных по человеческим генам и генетическим заболеваниям. Ее создал доктор МакКасик (Victor A. McKusick) с коллегами в центре медицинской генетики (Johns Hopkins University, Baltimore, USA). NCBI поддерживает наполнение и обновление базы. Сайт содержит общие обзоры по заболеваниям и конкретным генам, а также ссылки на базы данных ENTREZ.
|
|