Геномные браузеры

1. UCSC

Для изучения был выбран ген белка трипсиногена - неактивной формы трипсина. Он превращается в трипсин в тонком кишечнике. Трипсиноген принадлежит к семейству трипсина, который в свою очередь принадлежит к классу сериновых протеаз. Они названы так потому, что в их активном центре содержится серин. Характеристика гена
Короткое имя гена PRSS1
Полное имя гена Serine protease 1
Цепь +
Хромосома 7
Локализация на хромосоме ch7:q34
Количество альтернативных продуктов в Gencode 2
Номер транскрипта в Gencode Число экзонов Число аминокислотных остатков
ENST00000486171.1 6 261
ENST00000311737.7 5 247

2. Ensembl

Исходный ген белка из задания 1 был выравнен с помощью Ensembl с геном белка шимпанзе. Файл выравнивания.
Затем с помощью команды distmat пакета Emboss было найдено количество несовпадений на 100 нуклеотидов.Файл с данными
Длина выравнивания - 3609 - была подсчитана с помощью команды:

infoalign al-chimp.fasta -only -alignlength -outfile len.txt


Общее количество замен (36,09 * 2,85) равно 102. (102,86)
Variant tables дают количество SNP - однонуклеотидных замен. Берем замены с частотой появления больше 0.001. Их получилось 426 штук.
Число несовпадений гена PRSS1 человека и шимпанзе отлчается от количества возможных полиморфизмов примерно в 4 раза.

© Нестеренко Екатерина 2018