Третий семестр

Задание 1. UCSC



Был проведен поиск белка в UCSC.

Короткое имя гена VLDLR
Полное имя гена Homo sapiens very low density lipoprotein receptor
На какой цепи он закодирован +
В какой хромосоме находится 9
К каким плечу и полосе принадлежит участок chr9:p24.2
Координаты гена в последовательности хромосомы 2621793-2654485
Сколько альтернативных продуктов закодировано в гене 1
Число экзонов 19
Длина аминокислотной последовательности 873

Далее представлено изображение окрестности гена из Genome Browser c треками:

pic_01

Рисунок 1

Задание 2. Ensembl


В задании требовалось построить выравнивание гена человека VLDLR с гомологичным геном шимпанзе, определить число различий и сравнить его числом часто встречающихся полиморфизмов (различий в геномах разных людей) в этом же гене.

Для того, чтобы построить выравнивание, VLDLR был найден в поиске Ensembl, затем в разделе Comparative Genomics - Genomic alignments можно выбрать выравнивание с шимпанзе. Файл с выравниванием: al.fasta. Программа distmat пакета EMBOSS вычисляет эволюционные "расстояния" для последовательностей во множественных выравниваниях, которые выражеются в числе замен на 100 нуклеотидов.С помощью неё было подсчитано число различий - 1.56 на 100 нуклеотидов, т.е последовательности можно считать достаточно близкими. Число полиморфизмов можно найти в разделах Genetic Variation - Vatiation table, оно составляет 4423.

Выходной файл программы distmat:al.distmat


Задание 3. NCBI Map Viewer


Для того, чтобы посмотреть на ген VLDLR в геномном браузере NCBI, можно просто ввести его название в поиске Map Viewer. Результат поиска - список хитов (среди них немало транскриптов) и картинка с их местоположением на хромосомах. Для того, чтобы оставить только гены, нужно воспользоваться фильтром:

pic_02

Рисунок 2. Результат поиска в Map Viewer

Кликнув по результату, можно перейти к просмотру гена:

pic_03

Рисунок 3. Ген VLDR в геномном браузере Map Viewer

В Map Viewer,в отличие от предыдущих браузеров, все визуальзированные данные "стоят" вертикально, что очень непривычно и сначала кажется неудобным. Как и везде, можно узнать название гена, его расположение на геноме, посмотреть на соседние гены. Помимо исследуемого гена, можно отображать другие треки, например, матричные РНК основных модельных животных, гены и транскрипты Ensembl, транскрипты RefSeq, контиги и другое. Есть представление информации в виде таблицы - ещё одно из отличий.

Для гена есть доступные ссылки на сервисы NCBI. Если возможно, то , перейдя по ним, можно загрузить последовательность, посмотреть на открытые рамки считывания, записи о белковых последовательностях в базе Protein, гомологичные гены, полиморфизмы, зайти на сайт HUGO Gene Nomenclature Committee, где описана основная информация о гене. Есть ссылка на Evidence viewer, где можно посмотреть, чем подтверждено существование данной последовательности. Ещё одна интересная ссылка - на Sequence Viewer - графическое отображение баз Nucleotide и Protein.

pic_04

Рисунок 4. Ген VLDR в Sequence Viewer

В общем, на мой взгляд, Map Viewer интересен тем, что он предоставляет быстрый доступ ко многим сервисам NCBI, в отличие от других геномных браузеров. Минусы, в основном, субъективного характера: оформление сайта, вертикальное расположение треков, вечная прокрутка слева направо, потому что треки не помещаются. Map Viewer мне показался наименее удобным.