Учебный сайт Орлова Артёма

Практикум 10. Геномные браузеры.

Задание 1. UCSC.

С помощью геномного браузера UCSC были получены сведения о гене, кодирующем белок RMI1 (RecQ-mediated genome instability protein 1). Данные приведены в таблице 1.

Таблица 1. Сведения об RMI1 из UCSC.

Имя гена

RMI1
(RecQ-mediated genome instability protein 1)

Gene ID

ENSG00000178966.16

Направление цепи

Прямое (+)

Расположение

chr9:q21.32 - полоса 21.32 в длинном (q) плече 9-ой хромосомы

Число транскриптов

2

Подробная информация о транскриптах приведена в таблице 2.

Таблица 2. Транскрипты RMI1.

Идентификатор Gencode

Координаты в хромосоме

Общее число экзонов

Длина последовательности белка

ENST00000325875.7 (GENCODE V32)

chr9:83.980.798-84.004.074

3

625ак

ENST00000445877.5 (GENCODE V31)

chr9:83.980.711-84.002.233

3

415ак

Изображение интерфейса геномного браузера приведно на рисунке 1. В окрестности гена показаны треки: транскрипты GENCODE и RefSeq, консервативность последовательности среди позвоночных, частые полиморфизмы.

Рис.1

Рисунок 1. (открыть в отдельной вкладке)

Задание 2. Ensembl.

С помощью геномного браузера Ensembl было получено выравнивание вышеописанного гена с гомологичным геном шимпанзе (скачать выравнивание).

Затем был оценён процент отличий человека и шимпанзе с помощью команды EMBOSS infoalign:

$ infoalign pr10_alignment.fasta -only -name -heading -seqlength -diffcount -filter                              
# Name        SeqLen    Differ
homo_sapiens_1-23446    23364   0
pan_troglodytes_1-23446 23395   203

Процент отличий был посчитан как отношение Differ к SeqLen шимпанзе. Таким образом, 203 / 23395 ≈ 0.87%. Полученное значение отклоняется от данных полногеномных различий 2005 года - 1.23% (источник). Это объясняется явным различием в сравнениях полных геномов и частных генов.