Практикум 10. Геномные браузеры.
Задание 1. UCSC.
С помощью геномного браузера UCSC были получены сведения о гене, кодирующем белок RMI1 (RecQ-mediated genome instability protein 1). Данные приведены в таблице 1.
Имя гена |
RMI1 |
Gene ID |
ENSG00000178966.16 |
Направление цепи |
Прямое (+) |
Расположение |
chr9:q21.32 - полоса 21.32 в длинном (q) плече 9-ой хромосомы |
Число транскриптов |
2 |
Подробная информация о транскриптах приведена в таблице 2.
Идентификатор Gencode |
Координаты в хромосоме |
Общее число экзонов |
Длина последовательности белка |
chr9:83.980.798-84.004.074 |
3 |
625ак |
|
chr9:83.980.711-84.002.233 |
3 |
415ак |
Изображение интерфейса геномного браузера приведно на рисунке 1. В окрестности гена показаны треки: транскрипты GENCODE и RefSeq, консервативность последовательности среди позвоночных, частые полиморфизмы.
![Рис.1](pr10_1.png)
Рисунок 1. (открыть в отдельной вкладке)
Задание 2. Ensembl.
С помощью геномного браузера Ensembl было получено выравнивание вышеописанного гена с гомологичным геном шимпанзе (скачать выравнивание).
Затем был оценён процент отличий человека и шимпанзе с помощью команды EMBOSS infoalign:
$ infoalign pr10_alignment.fasta -only -name -heading -seqlength -diffcount -filter # Name SeqLen Differ homo_sapiens_1-23446 23364 0 pan_troglodytes_1-23446 23395 203
Процент отличий был посчитан как отношение Differ к SeqLen шимпанзе. Таким образом, 203 / 23395 ≈ 0.87%. Полученное значение отклоняется от данных полногеномных различий 2005 года - 1.23% (источник). Это объясняется явным различием в сравнениях полных геномов и частных генов.