Для изучения был выбран ген белка трипсиногена - неактивной формы трипсина. Он превращается в трипсин
в тонком кишечнике. Трипсиноген принадлежит к семейству трипсина, который в свою очередь
принадлежит к классу сериновых протеаз. Они названы так потому, что в их активном центре содержится серин.
Характеристика гена
Короткое имя гена |
PRSS1 |
Полное имя гена |
Serine protease 1 |
Цепь |
+ |
Хромосома |
7 |
Локализация на хромосоме |
ch7:q34 |
Количество альтернативных продуктов в Gencode |
2 |
Номер транскрипта в Gencode |
Число экзонов |
Число аминокислотных остатков |
ENST00000486171.1 |
6 |
261 |
ENST00000311737.7 |
5 |
247 |
Исходный ген белка из задания 1 был выравнен с помощью Ensembl с геном белка шимпанзе.
Файл выравнивания.
Затем с помощью команды distmat пакета Emboss было найдено количество несовпадений на
100 нуклеотидов.
Файл с данными
Длина выравнивания - 3609 - была подсчитана с помощью команды:
infoalign al-chimp.fasta -only -alignlength -outfile len.txt
Общее количество замен (36,09 * 2,85) равно 102. (102,86)
Variant tables дают количество SNP - однонуклеотидных замен. Берем замены с частотой появления
больше 0.001. Их получилось 426 штук.
Число несовпадений гена PRSS1 человека и шимпанзе отлчается от количества возможных полиморфизмов примерно в 4 раза.