С помощью геномного браузера UCSC были получены данные о гене, кодирующем homo sapiens amylase alpha 1A (AMY1A) (таблица №1)
Информация о продукте содержится в таблице №2
Имя гена | Homo sapiens amylase alpha 1A (AMY1A) |
Идентификатор в Gencode | ENSG00000237763.9 |
Цепь | + |
Расположение в хромосоме | hg38 chr1:p21.1:103,656,331-103,664,520 (p-плечо 1 хромосомы, полоса 21.1) |
Число транскриптов | 1 |
таб.1
Идентификатор в Gencode | ENST00000370083.8 |
Расположение в хромосоме | hg38 chr1:103,655,755-103,664,554 |
Общее число экзонов | 11 |
Длина последовательности белка | 8,800 |
таб.2
Окрестность гена c треками:
-транскрипты GENCODE и RefSeq
-консервативность последовательности среди позвоночных (Conservation)
-частые полиморфизмы (Common SNPs) последней версии (151)
рис.1
Выравнивание гена, кодирющего AMY1A и гомологичного гена шимпанзе было получено с помощью геномного браузера Ensembl
Ссылка на выравнивание: align_chim.fasta
Подсчёт числа различий:
fp.delta@kodomo:~/public_html/term3/somefiles/pr10$ infoalign -only -name -heading -seqlen -diffcount -filter align_chim.fasta >results1.fasta
fp.delta@kodomo:~/public_html/term3/somefiles/pr10$
Результат:
# Name SeqLen Differ homo_sapiens_1-7241 7225 0 pan_troglodytes_1-7241 7228 183
Ссылка на файл с результатами: results1.fasta
Процент различия подсчитать довольно просто (отношение Differ к SeqLen * 100%):
183/72288*100 ~ 2.53%
Скорее всего результат отличается от источника (~ 1.2%; A genome-wide survey of structural variation between human and chimpanzee), так как сравниваем конкретные участки, а не полные сборки геномов.