Геномные браузеры

UCSC

Описание гена белка syncytin-1[1]:

Имя генаERVW-1
Идентификатор гена в GencodeENSG00000242950.7
Направление цепи"-"-strand
Номер хромосомы7
Плечо и полоса хромосомыДлинное плечо, полоса 21.2
Количество альтернативных транскриптов2
Транскрипт 1Идентификатор транскрипта в GencodeENST00000603053.2
Координаты в хромосоме вместе с 5'- и 3'-UTR92,468,380..92,477,946
Число экзонов2
Длина последовательности белка538 aa
Транскрипт 2Идентификатор транскрипта в GencodeENST00000493463.2
Координаты в хромосоме вместе с 5'- и 3'-UTR92,468,381..92,471,305
Число экзонов1
Длина последовательности белка538 aa


Окрестности гена ERVW-1:

Открыть изображение на новой странице

Комментарий: Показаны окрестности гена ERVW-1 (выделен голубым полем) с включёнными треками генов GENCODE v32 и NCBI RefSeq, консервативности среди позвоночных Conservation и распространённых полиморфизмов Common SNPs(151).
Ген ERVW-1 ("-"-strand) фланкирован со стороны центромеры нетранскрибируемым участком и геном GATAD1 ("+"-strand), а со стороны теломеры - нетранскрибируемым участком и геном PEX1 ("-"-strand).


Ensembl

С помощью геномного браузера Ensembl было получено выравнивание гена ERVW-1 человека и шимпанзе.

Программой infoalign из этого выравнивания была получена информация о различии в последовательностях гена ERVW-1 человека и шимпанзе:
Команда: infoalign ervw1.msf -auto -only -heading -name -alignlen -gapcount -diffcount
Вывод программы:

# Name        AlignLen	GapLen	Differ	
homo_sapiens/1-9618	9618	11	0
pan_troglodytes/1-9618	9618	4	94
Комментарий:Программа вычисляет консенсусную последовательность из 2 данных, переписывая первую последовательность (в данном случае человеческого гена) и заменяя в ней гэпы на нуклеотиды из второй последовательности (в данном случае гена шимпанзе), и сравнивает её с 2 исходными, не учитвая несовпадения в гэпах. Таким образом, с первой последовательностью различий быть не может, тогда как различия со второй последовательностью - это различия между 2 исходными последовательностями в позициях без гэпов (т. е. нуклеотидные замены).

Различие между двумя последовательностями вычисляется по формуле (Differ(pan) + GapLen(homo) + GapLen(pan)) / AlignLen = 1.13%
Это значение сильно меньше различия между полными геномами человека и шимпанзе, составляющим 4-5%[2][3], что может быть обусловлено меньшей скоростью дивергенции последовательности генов (особенно, их кодирующих участков), по сравнению со скоростью дивергенции геномов, содержащих значительную долю некодирующих последовательностей.
Однако различие между данными ортологичными генами без учёта инделей, вычисленное по формуле Differ(pan) / AlignLen = 0.98%, имеет более близкое значение к различию между соответствующими геномами без учёта инделей, составляющему 1.06-1.23%[3], что об'ясняется тем, что индели достаточно редки в последовательности генов, ибо их возникновение на любом участке гена может приводить к сдвигу рамки считывания - неизбежному нокауту гена.


Ссылки

  1. Syncytin-1 - Wikipedia
  2. Britten, R. (2002) Divergence between samples of chimpanzee and human DNA sequences is 5%, counting indels
  3. Waterson, R. (2005) Initial sequence of the chimpanzee genome and comparison with the human genome
Главная страница


© Степан Пухов

2019