|
UCSC
Описание гена белка syncytin-1[1]:
Имя гена | ERVW-1 |
Идентификатор гена в Gencode | ENSG00000242950.7 |
Направление цепи | "-"-strand |
Номер хромосомы | 7 |
Плечо и полоса хромосомы | Длинное плечо, полоса 21.2 |
Количество альтернативных транскриптов | 2 |
Транскрипт 1 | Идентификатор транскрипта в Gencode | ENST00000603053.2 |
Координаты в хромосоме вместе с 5'- и 3'-UTR | 92,468,380..92,477,946 |
Число экзонов | 2 |
Длина последовательности белка | 538 aa |
Транскрипт 2 | Идентификатор транскрипта в Gencode | ENST00000493463.2 |
Координаты в хромосоме вместе с 5'- и 3'-UTR | 92,468,381..92,471,305 |
Число экзонов | 1 |
Длина последовательности белка | 538 aa |
|
Окрестности гена ERVW-1:
Открыть изображение на новой странице
Комментарий: Показаны окрестности гена ERVW-1 (выделен голубым
полем) с включёнными треками генов GENCODE v32 и NCBI RefSeq,
консервативности среди позвоночных Conservation и распространённых
полиморфизмов Common SNPs(151).
Ген ERVW-1 ("-"-strand) фланкирован со стороны центромеры нетранскрибируемым
участком и геном GATAD1 ("+"-strand), а со стороны теломеры -
нетранскрибируемым участком и геном PEX1 ("-"-strand).
|
|
Ensembl
С помощью геномного браузера Ensembl было получено
выравнивание гена ERVW-1 человека и шимпанзе.
Программой infoalign из этого выравнивания была получена информация
о различии в последовательностях гена ERVW-1 человека и шимпанзе:
Команда: infoalign ervw1.msf -auto -only -heading -name -alignlen
-gapcount -diffcount
Вывод программы:
# Name AlignLen GapLen Differ
homo_sapiens/1-9618 9618 11 0
pan_troglodytes/1-9618 9618 4 94
Комментарий:Программа вычисляет консенсусную последовательность
из 2 данных, переписывая первую последовательность (в данном случае
человеческого гена) и заменяя в ней гэпы на нуклеотиды из второй
последовательности (в данном случае гена шимпанзе), и сравнивает её
с 2 исходными, не учитвая несовпадения в гэпах. Таким образом, с первой
последовательностью различий быть не может, тогда как различия со
второй последовательностью - это различия между 2 исходными
последовательностями в позициях без гэпов (т. е. нуклеотидные замены).
Различие между двумя последовательностями вычисляется по формуле
(Differ(pan) + GapLen(homo) + GapLen(pan)) / AlignLen = 1.13%
Это значение сильно меньше различия между полными геномами
человека и шимпанзе, составляющим 4-5%[2][3], что может быть
обусловлено меньшей скоростью дивергенции последовательности генов (особенно,
их кодирующих участков), по сравнению со скоростью дивергенции геномов,
содержащих значительную долю некодирующих последовательностей.
Однако различие между данными ортологичными генами без учёта инделей,
вычисленное по формуле Differ(pan) / AlignLen = 0.98%, имеет более
близкое значение к различию между соответствующими геномами без учёта инделей,
составляющему 1.06-1.23%[3], что об'ясняется тем, что индели
достаточно редки в последовательности генов, ибо их возникновение на любом
участке гена может приводить к сдвигу рамки считывания - неизбежному нокауту
гена.
|
Ссылки
-
Syncytin-1 - Wikipedia
-
Britten, R. (2002) Divergence between samples of chimpanzee
and human DNA sequences is 5%, counting indels
-
Waterson, R. (2005) Initial sequence of the chimpanzee genome
and comparison with the human genome
|
|
|