Практикум 10.Геномные браузеры

Задание 1. UCSC

АТР Серин / треонин киназа.

Белок, кодируемый этим геном, представляет собой Серин/треонинкиназу и датчик повреждения ДНК, активирующий сигнал контрольной точки клеточного цикла при стрессе ДНК. Закодированный белок может фосфорилировать и активировать несколько белков, участвующих в ингибировании репликации ДНК и митоза, и может способствовать репарации ДНК, рекомбинации и апоптозу. Дефекты гена белка являются причиной синдрома Секеля 1.
Таблица 1.
Имя гена ATR
Идентификатор гена в Gencode ENSG00000175054
Цепь обратная
Хромосома chr3:142,168,077-142,297,668
Плечо и полоса chr3:q23
Альтернативные продукты 2
Транскрипты ENST00000350721.9 chr3:142,449,235-142,578,733
Total Exon Count: 47 Protein (2644 aa)
ENST00000661310.1 chr3:142,449,429-142,578,704
Total Exon Count: 46 Protein (2580 aa)

Ниже представлена ссылка на полну картинку окрестности гена из Genome Browser c треками: транскрипты GENCODE и RefSeq, консервативность последовательности среди позвоночных (Conservation), частые полиморфизмы (Common SNPs) последней версии (151).

Изображение

Задание 2. Ensembl

После выравнивания гена ATR с гомологичным геном шимапнзе я получила файл в fasta формате:

fasta

С помощью команды "infoalign -refseq 1 CH.fasta" я получила файл с данными сравнения генов. Берем необходимую информацию из таблицы и получаем, что процент различий равен: 1285/129979*100= 0,989 %

Если сравнивать результат с полногеномной оценкой, можно заметить, что он соответствует данному значению. Оно получается при сравнении отдельных букв генетического кода в кодирующей ДНК. Здесь исследователи насчитали 35 миллионов расхождений, что и составило 1,2 % от всего генома шимпанзе, который насчитывает около 3-х миллиардов 100 миллионов нуклеотидных пар. Но это далеко не всё: существенные различия были обнаружены и в распределении тех последовательностей нуклеотидных оснований, которые образуют некодирующую ДНК. Эти несовпадения составили ещё 2,7 процента от всего генома, что дало в сумме уже почти 4 процента. Полученное мной значение даже меньще заявленных 4 %. Информацию об исследовании можно скачать по ссылке:

Nature

Таблица 2.
# USA Name SeqLen AlignLen Gaps GapLen Ident Similar Differ %Change Weight
CH.fasta:homo_sapiens_1-129979 homo_sapiens_1-129979 129727 129979 71 252 129727 0 0 0.193877 1.000000
CH.fasta:pan_troglodytes_1-129979 pan_troglodytes_1-129979 129302 129979 74 677 128017 0 1285 1.509475 1.000000