Задание 1. UCSC
Был проведен поиск белка в UCSC.
Короткое имя гена | VLDLR |
Полное имя гена | Homo sapiens very low density lipoprotein receptor |
На какой цепи он закодирован | + |
В какой хромосоме находится | 9 |
К каким плечу и полосе принадлежит участок | chr9:p24.2 |
Координаты гена в последовательности хромосомы | 2621793-2654485 |
Сколько альтернативных продуктов закодировано в гене | 1 |
Число экзонов | 19 |
Длина аминокислотной последовательности | 873 |
Далее представлено изображение окрестности гена из Genome Browser c треками:
- гены UCSC и RefSeq (UCSC Genes и RefSeq Genes)
- метилирование ДНК (ENC_DNA_Methylation)
- консервативность последовательности среди млекопитающих (Conservation)
- полиморфизмы (Common SNPs)
Задание 2. Ensembl
В задании требовалось построить выравнивание гена человека VLDLR с гомологичным геном шимпанзе, определить число различий и сравнить его числом часто встречающихся полиморфизмов (различий в геномах разных людей) в этом же гене.
Для того, чтобы построить выравнивание, VLDLR был найден в поиске Ensembl, затем в разделе Comparative Genomics - Genomic alignments можно выбрать выравнивание с шимпанзе. Файл с выравниванием: al.fasta. Программа distmat пакета EMBOSS вычисляет эволюционные "расстояния" для последовательностей во множественных выравниваниях, которые выражеются в числе замен на 100 нуклеотидов.С помощью неё было подсчитано число различий - 1.56 на 100 нуклеотидов, т.е последовательности можно считать достаточно близкими. Число полиморфизмов можно найти в разделах Genetic Variation - Vatiation table, оно составляет 4423.
Выходной файл программы distmat:al.distmat
Задание 3. NCBI Map Viewer
Для того, чтобы посмотреть на ген VLDLR в геномном браузере NCBI, можно просто ввести его название в поиске Map Viewer. Результат поиска - список хитов (среди них немало транскриптов) и картинка с их местоположением на хромосомах. Для того, чтобы оставить только гены, нужно воспользоваться фильтром:
Кликнув по результату, можно перейти к просмотру гена:
В Map Viewer,в отличие от предыдущих браузеров, все визуальзированные данные "стоят" вертикально, что очень непривычно и сначала кажется неудобным. Как и везде, можно узнать название гена, его расположение на геноме, посмотреть на соседние гены. Помимо исследуемого гена, можно отображать другие треки, например, матричные РНК основных модельных животных, гены и транскрипты Ensembl, транскрипты RefSeq, контиги и другое. Есть представление информации в виде таблицы - ещё одно из отличий.
Для гена есть доступные ссылки на сервисы NCBI. Если возможно, то , перейдя по ним, можно загрузить последовательность, посмотреть на открытые рамки считывания, записи о белковых последовательностях в базе Protein, гомологичные гены, полиморфизмы, зайти на сайт HUGO Gene Nomenclature Committee, где описана основная информация о гене. Есть ссылка на Evidence viewer, где можно посмотреть, чем подтверждено существование данной последовательности. Ещё одна интересная ссылка - на Sequence Viewer - графическое отображение баз Nucleotide и Protein.
В общем, на мой взгляд, Map Viewer интересен тем, что он предоставляет быстрый доступ ко многим сервисам NCBI, в отличие от других геномных браузеров. Минусы, в основном, субъективного характера: оформление сайта, вертикальное расположение треков, вечная прокрутка слева направо, потому что треки не помещаются. Map Viewer мне показался наименее удобным.