РЕСЕКВЕНИРОВАНИЕ. ПОИСК ПОЛИМОРФИЗМОВ У ЧЕЛОВЕКА.

I. ПОДГОТОВКА ЧТЕНИЙ

В данном практикуме работа велась с чтениями экзома, картирующимися на участок хромосомы человека. Файл chr16.fastq с одноконцевыми чтениями в формате fastq был взят из директории на kodomo /P/y14/term3/block4/SNP/reads .
Подготовка чтений осуществлялась в несколько этапов:

Анализ качества прочтений
Очистка чтений
Сравнение параметров прочтений до и после очистки

АНАЛИЗ КАЧЕСТВА ПРОЧТЕНИЙ

Анализ прочтений был осуществлен с помощью прогрммы FASTQC, установленной на сервере kodomo. Результатом работы программы является папка, содержащая отчет о качестве прочтений, сопровожденный различными графическими изображениями, ознакомится с которыми можно ниже (Таблица 1., Рис.1, Рис.3, Рис.5, Рис.7, Рис.9). Программа была запущена с помощью следующей команды:

fastqc chr16.fastq

ОЧИСТКА ЧТЕНИЙ

Очистка чтений проводилась с использованием программы Trimmomatic. Были удалены чтения с длиной менее 50 нуклеотидов (параметр MINLEN:50) и с концов каждого чтения были отрезаны нуклеотиды с качеством ниже 20 (параметр TRAILING:20). Ниже приведена команда:

java -jar /usr/share/java/trimmomatic.jar SE -phred33 chr16.fastq chr16_after.fastq TRAILING:20 MINLEN:50

СРАВНЕНИЕ ПАРАМЕТРОВ ЧТЕНИЙ ДО И ПОСЛЕ ЧИСТКИ

После очистки прочтений был проведен анализ полученного файла, с использованием команды описанной выше. Ниже, в Таблице 1 представлены основные параметры прочтений до и после чистки, а на Рис. 1-10, полученных с помощью программы FASTQC, результаты представлены графически.

Таблица 1. Характеристика прочтений до и после чистки.

Параметр	Исходный файл	После чистки
Total Sequences	3965	3798
Sequences flagged as poor quality	0	0
Sequence length	100	50-100
%GC	53	52

Как видно из Таблицы 1, количество прочтений после чистки уменьшилось на 167 ридов, видимо, за счет удаления ридов, длина которых меньше 50 пн.

Рис.1 График Quality scores для основания в чтении на данной позиции ДО ЧИСТКИ.	Рис.2 График Quality scores для основания в чтении на данной позиции ПОСЛЕ ЧИСТКИ.
Данные графики типа boxplot, показывают Quality scores (вертикальная ось) для каждой позиции прочтений (горизонтальная ось). При этом красная линия отображает медиану разброса значений Quality scores среди оснований всех ридов находящихся на данной позиции, голубая линия - среднее, желтые столбцы ограничены верхним и нижним квартилями, "усы" отражают значения 10ого и 90ого процентиля. Красная область показывает позиции, характеризующиеся низким Quality score (<28), оранжевая средним, зеленая высоким (>20). Как можно отметить, до очистки чтения обладают достаточно низкими параметрами: из 55 столбцов, у 19 90ый процентиль заходит в орнжевую зону, у 14 в красную. По данному графику, что качество чтений низкое. После чистки ситуация существенно поменялась: за счет отрезания с концов ридов нуклеотидов с Quality scores меньше 20, этот параметр существенно возрос, в результате чего почти все столбцы полностью оказались в зеленой зоне, за исключением 17, "верхние усы" которых расположились в оранжевой зоне.
Рис.3 График процентного содержания четерых типов нуклеотидов в данной позиции прочтений ДО ЧИСТКИ.	Рис.4 График процентного содержания четерых типов нуклеотидов в данной позиции прочтений ПОСЛЕ ЧИСТКИ.
Данные графики показывает какой процент занинает нуклеотид данного типа среди всех нуклеотидов встречающихся в данной позиции ридов. На вертикальной оси отложен процент встречаемости, на горизонтальной - позиция. Как видно, очистка не сильно повлияла на данный параметр, что согласуется с данными представленными в Таблице 1. Однако этот параметр согласно руководству далек от идеального результата.
Рис.5 График распределения соотношения GC% по всем прочтениях ДО ЧИСТКИ.	Рис.6 График распределения соотношения GC% по всем прочтениях ПОСЛЕ ЧИСТКИ.
Данные графики показывает насколько отличается распределение процентного содержания пары GC в риде от теоретически рассчитанного. На горизонтальной оси отложен GC%, на вертикальной число ридов с таким значением GC%. Чистка существенно не повлияла на распределение этого параметра. В обоих случаях практическое распределение довольно сильно отличается от теоретически рассчитанного.
Рис.7 График распределения Quality score всего прочтиния ДО ЧИСТКИ.	Рис.8 График распределения Quality score всего прочтиния ПОСЛЕ ЧИСТКИ.
Данные графики показывает распределение Quality score прочтений. По горизонтальной оси отложены значения Quality score прочтений, по вертикальной число прочтений в котором такое значение встречается. Как видно, после чистки, засчет отрезаня нуклеотидов с низким значением Quality score, график существенно поменялся. После чистки в графике отсутствуют значения Quality score ниже 20.
Рис. 9 График распределения длины прочтений ДО ЧИСТКИ	Рис. 10 График распределения длины прочтений ПОСЛЕ ЧИСТКИ
На данном графике изображено распределение длин прочтений. По горизонтальной оси отложены длины прочтений, по вретикольной - чило прочтений с этими длинами. После чистки график очень существенно поменялся. Если до чистки длина прочтений в среднем составляла 100 пн, после чистки за счет удаления концевых нуклеотидов стала колебаться от 50 до 100.

II.КАРТИРОВАНИЕ ЧТЕНИЙ

КАРТИРОВАНИЕ ЧТЕНИЙ

Очищенные чтения были откратрированы с помощью программы Hisat2 в несколько этапов:

1.Экспорт программы в текущую директорию

export PATH=${PATH}:/home/students/y06/anastaisha_w/hisat2-2.0.5

2.Индексирование референсной последовательности

hisat2-build chr16.fasta chr16

3.Построение выравнивания прочтений и референса в формате .sam

hisat2 -x chr16 -U chr16_after.fastq --no-spliced-alignment --no-softclip > alignment1_chr16.sam

АНАЛИЗ ВЫРАВНИВАНИЯ

1. Полученный файл с выравниванием был переведен в бинарный формат .bam c использованием программы из пакета samtools - samtools view:

samtools view alignment1_chr16.sam -bo alignment1_chr16.bam

2. Выравнивание чтений с референсом было отсортировано по координате в референсе начала чтения при помощи программы samtools sort:

samtools sort alignment1_chr16.bam -T temporary.txt -o sorted1.bam

3. Командой samtools index полученный файл был проиндексирован:

samtools index sorted1.bam

Выход программы Hisat2

Согласно данным полученным на выходе из программы Hisat2, из 3798 неповторяющихся прочтений:

33 прочтения (0.87%) не участвовали в построении выравниваия
3763 прочтения (99.08%) были выравнены ровно один раз
2 (0.05%) выравнивались более одного раза.
Значение overall aligment rate - 99.13%

Определение среднего значения покрытия экзона чтениями

1. С помощью команды samtools depth было вычислено покрытие чтениями для каждого нуклеотида. С помощью функции МАКС из пакета Excel было найдено максимальное значение покрытия - 208 для нуклеотида 11362870.

samtools depth sorted1.bam>sorted_depth.txt

2. С использованием GenomeBrowser для 16 хромосомы версии Hg19, был обнаружен экзон в состав которого входит данный нклеотид и его координаты.

Рис.11 Ген и Экзоны в состав которых входит нуклеотид 11362870.

3. Для каждого нуклеотида входящего в экзон вновь были посчитаны покрытия. С помощью функции СРЗНАЧ пакета Excel было посчитано среднне покрытие для данного экзона, которое составило 139,735.

depth -r chr16:11362720-11363119 sorted1.bam>exon_depth.txt

III. АНАЛИЗ SNP

ПОИСК SNP И ИНДЕЛЕЙ

1. С помощью программы samtools mpileup -uf был создан файл с полиморфизмами в формате .bcf:

samtools mpileup -uf chr16.fasta sorted1.bam >snp.bcf

2. Файл со списком отличий между референсом и чтениями в формате .vcf был создан с использованием команды "bcftools call -cv" пакета bcftools:

bcftools call -vc snp.bcf >snp.vcf

3. Полученный файл содержал информацию о 65 полиморфизмах, 1 из которых явлеяется инделем, остальны 64 - единичные замены. Ниже в Таблице 2. приведены данные о трех полиморфизмах.

Таблица 2. Описание трех полиморфизмов.

Координата	Тип полиморфизма	Референс	Прочтение	Глубина прочтения	Качество чтения
56969148	Замена	G	A	80	225.009
56968938	Замена	С	A	3	3.5427
11444454	Делеция	gaaaaaaaaaaa	gaaaaaaaaaa,gaaaaaaaaa	55	10.8299

Покрытие найденных SNP варьируется в пределах от одного до 145, среднее значение достигает 17,5625. Качество ридов начинается от 3,5427 и заканчивается 225,009, в среднем составляет 76,87, что является очень высоким показателем. Можно ознакомиться с файлом snp.vcf, полученным на выходе программы, содержащим все значения.

АННОТАЦИЯ SNP

С помощью программы annovar полученные полиморфизмы были проаннотированы по следующим базам данных:

Refgene
Dbsnp
1000 genomes
GWAS
Clinvar

Первоначльно, для работы с программой annovar необходимо было перевести файл в формат, подходящий для работы программы:

perl /nfs/srv/databases/annovar/convert2annovar.pl -format vcf4 snp.vcf -outfile snp.avinput

После, с помощью annovar snp были проаннотриованы по базам данных. Ниже представлены команды для получения аннотаций и результат их работы в краткой форме.

1. REFGENE

perl /nfs/srv/databases/annovar/annotate_variation.pl -out rs.refgene -build hg19 snp.avinput /nfs/srv/databases/annovar/humandb/

На выходе работы программы были получены три файла (rs.refgene.exonic_variant_function - информация о полиморфизмах в экзонах; rs.refgene.log - информация о процессе работы программы; rs.refgene.variant_function - информация о локализации полиморфизма по отношению к функциональным частям генома), сождержащих информацию о полиморфизмах, которая в кратком виде представлена в Таблицах 3, 4, 5.

Таблица 3. Локализация полиморфизмов в геноме

Категория	Пояснение	Количество SNP
downstream	snp за пределами гена	2
upstream	snp за пределами гена	5
UTR5	snp в 5' нетранслируемой области	3
UTR3	snp в 3' нетранслируемой области	3
intronic	snp в интроне	24
exonic	snp в экзоне	9
intergenic	snp входящая в несколько перекрывающихся генов	19

Как видно из Таблицы 3, из всех полиморфизмов лишь небольшое количество содержится в экзонах.

Всего snp попали в 8 генов, ниже приведена таблица, указывающая сколько snp в них располагается.

Таблица 4. Гены, содержащие snp.

Ген	Число Snp	Область	Функция гена (Кодирует:)
SOCS1	1	1 downstream	Cупрессор сигнального цитокина 1
TNP2	4	1 экзон, 3 интрона	Переходный ядерный белок сперматид 2
PRM3	5	2 экзона, 3 upstream	Протамин 3
PRM2	4	2 экзона, 1 UTR3, 1 downstream	Протамин 2
PRM1	21	1 экзон, 19 интегральных, 1 upstream	Протамин 1
RMI2	35	1 экзон, 19 интегральных, 1 UTR5, 2 UTR3, 12 интронов	RecQ-mediated genome instability protein 2
PRSS53	9	1 экзон, 8 интронов	Серин-протеаза 59
HERPUD1	5	1 экзон, 1 интрон, 1 upstream, 2 UTR5	Homocysteine-responsive endoplasmic reticulum-resident ubiquitin-like domain member 1 protein

Все вышеперечисленные гены - белок-кодирующие, их белки выполняют совершенно различные функции:

SOCS1 вовлечен в неготивную регуляцию цитокинов, которые учавствуют в регуляции JAK/STAT3 пути. Через связывание JAKs, SOCS1 ингибирует их киназную активность.

TNP2 играет ключевую роль в замене гистонов на протамин в удлиненных сперматидах млекопитающих. В конденсирующих сперматидах, загружаемых на нуклеосомы, где он способствует обработке протаминов, которые ответственны за выселение гистонов

PRM1/2/3 - протамины замещают гистоны в хроматине сперматозойдов во время гаплоидной фазы сперматогенза. Они компактизируют ДНК сперматозойдов в высококонденсированный, стабильный и неактивный комплекс.

RMI2 - необходимый компонент RMI комплекса,который играет важную роль в процессинге интермедиатов гомологичной рекомбинации. Необходим для регулирования сегрегации сестренских хроматид и ограничения ДНК кроссовера.

PRSS53 - in vitro может разоушать альфа-цепи фибриногена так же хорошо как плазминоген активатор про-урокиназного типа.

HERPUD1 - компонент система контроля качества эндоплазматического ретикулума (ERQC), вовлечен в убхитин- зависимую деградацию неправильно уложенных белков эндоплазматического ретикулума.

В Таблице 5 предствалена информация о snp, содержащихся в экзонах, о качестве произошедшей в низ замены, об аминокислотной замене.

Таблица 5. Характериситка snp в экзонах.

Ген	Координата	Референс	Прочтение	Качество	Покрытие	Синонимичность замены	Аминокислотная замена
TNP2	11362729	G	A	225.009	145	Несинонимичная	R131W
PRM3	11367143	G	A	221.999	35	Нонссенс-мутация (появление стоп-кодона)	R104X
PRM3	11367154	C	T	221.999	30	Несинонимичная	R100Q
PRM2	11369938	G	A	125.008	27	Несинонимичная	P97L
PRM2	11369947	G	A	139.008	27	Несинонимичная	A94V
PRM1	11374866	G	T	221.999	38	Синонимичная	R47R
RMI2	11444572	A	C	225.009	113	Синонимичная	T123T
PRSS53	31096164	G	C	148.077	7	Несинонимичная	P406A
HERPUD1	56969148	G	A	225.009	80	Несинонимичная	R50H

2.DBSNP

perl /nfs/srv/databases/annovar/annotate_variation.pl -filter -out rs.snp -build hg19 -dbtype snp138 snp.avinput /nfs/srv/databases/annovar/humandb/

На выходе программа дает три файла, один из которых (rs.snp.log) содержит информацию о работе программы, другой (rs.snp.hg19_snp138_dropped) содержит данный о референсних SNP, характеризующихся пометкой rs, третий (rs.snp.hg19_snp138_filtered) с snp данной отметкой не обладающими.

Из 65 полиморфизмов 7 не помечены rs, для остальных 48 присваивается rs идентификатор, можно ознакомится с файлом rs.snp.hg19_snp138_dropped, содержащим информацию об rs идентификаторе, заменах, их коордикатах, покрытии и качесстве.

3.1000 GENOMES

perl /nfs/srv/databases/annovar/annotate_variation.pl -filter -out rs.1000genomes -buildver hg19 -dbtype 1000g2014oct_all snp.avinput /nfs/srv/databases/annovar/humandb/

Аналгично двум предыдущим командам, данная дает на выдачу три файла:

rs.1000genomes.log - информация о работе программы
rs.1000genomes.hg19_ALL.sites.2014_10_dropped - информация о частоте встречаемости snp, содержащихся в базе данных
rs.1000genomes.hg19_ALL.sites.2014_10_filtered - спиок snp, не содержащихся в базе данных

Из 65 полиморфизмов 7 не встречаются в базе данных 1000 genomes, 48 была присвоена частота встречаемости, с которой можно ознакомится в файле rs.1000genomes.hg19_ALL.sites.2014_10_dropped, полученном в ходе роботе программы.

Наиболее высокая частота встречаемости среди данных полиморфизмов - 0,984026 (замена, расположенная в интроне гена PRSS53), самая низкая - 0,00499201 (замена, расположенная в интроне гена RMI2).Среднее значение для частоты встречаемости - 0,464222799. В таблице 6 приведена информация о частоте полиморфизмов, встречающихся экзонах.

Таблица 6. Встречаемость snp, локализованных в экзонах.

Ген	Встречаемость	Референс	Прочтение	Координата	Синонимичность
TNP2	0.333267	G	А	11362729	Несинонимичная
PRM3	0.956669	G	A	11367143	Нонссенс-мутация (появление стоп-кодона)
PRM3	0.770168	C	T	11367154	Несинонимичная
PRM2	0.0289537	G	A	11369938	Несинонимичная
PRM2	0.0289537	G	A	11369947	Несинонимичная
PRM1	0.487819	G	T	11374866	Синонимичная
RMI2	0.178115	A	C	11444572	Синонимичная
PRSS53	0.479034	G	C	31096164	Несинонимичная
HERPUD1	0.148762	G	A	56969148	Несинонимичная

Любопытно, что snp, приводящая к образованию стоп-кодона в гене обладает очень высокой частотой встречаемости (0.956669). В целом частота встречаемости данных полиморфизмов в экзонах довольно высока.

4.GWAS

perl /nfs/srv/databases/annovar/annotate_variation.pl -regionanno -out rs.gwas -build hg19 -dbtype gwasCatalog snp.avinput /nfs/srv/databases/annovar/humandb/

На выходе программы было получено два файла. Один из них (rs.gwas.log) содержит информацию о работе программы, другой (rs.gwas.hg19_gwasCatalog)содержат информаию о snp, вызывающих фенотипические проявления. Этот файл rs.gwas.hg19_gwasCatalog содержит информацию о трех из 65 snp, вызывающих различные фенотипические проявления. В таблице 7 представлена информация об snp, вызывающих фенотипические проявления и их локализации в геноме.

Таблица 7. Встречаемость snp, локализованных в экзонах.

Ген	Проявление	Замена	Локализация	Синонимичность	Координата	Встречаемость	Качество
PRM1	Черты, связанные с проявлением ожирения	G -> T	Экзон	Сининимичная	11374866	0.487819	221.999
PRSS53	Болезнь Паркинсона	C -> T	Интрон	-	31095171	0.479233	221.999
HERPUD1	Метаболический синдром	G -> A	Экзон	Несинонимичная	56969148	0.148762	225.009

Как видно из таблицы, из 65 snp встречаются три, вызывающие довольно яркие фенотипические проявления:

Метаболический синдром - увеличение массы висцерального жира, снижение чувствительности периферических тканей к инсулину и гиперинсулинемия, которые нарушают углеводный, липидный, пуриновый обмен, а также вызывают артериальную гипертензию.
*Ассоциирован с spn в гене HERPUD1, ответственным за производство белка, осуществляющего контроль качества ЭР и деградацию неправильно уложенных белков ЭР.

Болезнь Паркинсона - медленно прогрессирующее хроническое неврологическое заболевание, характерное для лиц старшей возрастной группы. Относится к дегенеративным заболеваниям экстрапирамидной моторной системы.
*Ассоциирована с spn в гене PRSS53, кодирующем белок Серин-протеаза 59.

Черты, присущие ожирению
*Ассоциированы с spn в гене PRM1, кодирующем протамин 1.

Довольно любопытно, что полиморфизм, ассоциированный с развитием болезни Паркинсона, согласно базе данных Refgene расположен внутри интрона. Не менее любопытное замечание заключается в том, что черты, связанные с ожирением ассоциированы с синонимичной заменой (!).Также, из таблицы видно, что полиморфизма, ассоциированные с проявлением данных фенотипов довольно распространены.

5.CLINVAR

perl /nfs/srv/databases/annovar/annotate_variation.pl -filter -out rs.clinvar -buildver hg19 -dbtype clinvar_20150629 snp.avinput /nfs/srv/databases/annovar/humandb/

Программа дает на выход три файла:

rs.clinvar.log - содержат данные о работе программы
rs.clinvar.hg19_clinvar_20150629_dropped- содержат данные об аннотированных в базе данных проявлениях snp
rs.clinvar.hg19_clinvar_20150629_filtered

К сожалению, по результату работы программы оказалось, что ни одна из описынных ранее 65 snp не аннотирована в базе данных Clinvar, и файл rs.clinvar.hg19_clinvar_20150629_dropped оказался пуст.

РЕЗУЛЬТАТЫ

Ниже, В Таблице 8 представленны все команды, использовавшиеся в данном практикуме. В Таблице 9 собраны данны по всем базам дынных для полученных 65 snp.

Таблица 8. Использванные команда

Команда	Действие
fastqc chr16.fastq	Анализ качества прочтений
java -jar /usr/share/java/trimmomatic.jar SE -phred33 chr16.fastq chr16_after.fastq TRAILING:20 MINLEN:50	Очистка чтений (отрезание концевых нуклеотидов с качеством ниже 20 и удаление чтений длиной меньше 50)
hisat2-build chr16.fasta chr16	Индексирование референсной последовательности
hisat2 -x chr16 -U chr16_after.fastq --no-spliced-alignment --no-softclip > alignment1_chr16.sam	Построение выравнивания прочтений и референса в формате .sam
samtools view alignment1_chr16.sam -bo alignment1_chr16.bam	Переведение файла в бинарный формат .bam
samtools sort alignment1_chr16.bam -T temporary.txt -o sorted1.bam	Сортирует выравнивание чтений с референсом по координате в референсе
samtools index sorted1.bam	Индексирует файл
samtools depth sorted1.bam>sorted_depth.txt	Вычисляет покрытие для каждого нуклеотида
depth -r chr16:11362720-11363119 sorted1.bam>exon_depth.txt	Вычисляет покрытия для нуклеотидов данного промежутка (экзона в этом случае)
samtools mpileup -uf chr16.fasta sorted1.bam >snp.bcf	Создает файл с полиморфизмами в формате .bcf
bcftools call -vc snp.bcf >snp.vcf	Создает список отличий между референсом и чтениями в формате .vcf
perl /nfs/srv/databases/annovar/convert2annovar.pl -format vcf4 snp.vcf -outfile snp.avinput	Переводит .vcf файл в формат .avinput
perl /nfs/srv/databases/annovar/annotate_variation.pl -out rs.refgene -build hg19 snp.avinput /nfs/srv/databases/annovar/humandb/	Пойск аннотаций заданных snp в базе данных Refgene
perl /nfs/srv/databases/annovar/annotate_variation.pl -filter -out rs.snp -build hg19 -dbtype snp138 snp.avinput /nfs/srv/databases/annovar/humandb/	Пойск аннотаций заданных snp в базе данных Refgene dbsnp
perl /nfs/srv/databases/annovar/annotate_variation.pl -filter -out rs.1000genomes -buildver hg19 -dbtype 1000g2014oct_all snp.avinput /nfs/srv/databases/annovar/humandb/	Пойск аннотаций заданных snp в базе данных 1000 genomes
perl /nfs/srv/databases/annovar/annotate_variation.pl -regionanno -out rs.gwas -build hg19 -dbtype gwasCatalog snp.avinput /nfs/srv/databases/annovar/humandb/	Пойск аннотаций заданных snp в базе данных GWAS
perl /nfs/srv/databases/annovar/annotate_variation.pl -filter -out rs.clinvar -buildver hg19 -dbtype clinvar_20150629 snp.avinput /nfs/srv/databases/annovar/humandb/	Пойск аннотаций заданных snp в базе данных Clinvar

Таблица 9. Аннотации snp по 5 базам данных. Красным, Желтым и зеленым помеченны snp, аннотированные в базе данных 1000 genoms, связанные с появлением определенных фенотипов (последняя колонка, расшифровка под таблицей).

Ген	rs	Координата	Зона	Замена	Qscore	Depth	Частота	Синоним.	Аминок.	Фен.
SOCS1	rs8060459	11348273	downstream	T -> A	4,1	10	0.007987	-	-	-
TNP2	rs8043625	11361895	intronic	C -> G	225	50	0,340855	-
TNP2	rs181695	11362554	intronic	T -> C	103	30	0,977236	-
TNP2	rs56069754	11362640	intronic	G -> A	167	50	0,164137	-
TNP2	rs11640138	11362729	exonic	G -> A	225	145	0,333267	nonsyn.	R131W
PRM3	rs438289	11367143	exonic	G -> A	222	35	0,956669	stopgain	R104X
PRM3	rs429744	11367154	exonic	C -> T	222	30	0,770168	nonsyn.	R100Q
PRM3	rs2301127	11367477	upstream	G -> A	222	14	0,593251	-
PRM3	rs2857764	11367907	upstream	G -> C	55	6	0,959265	-
PRM3	rs74007622	11368053	upstream	G -> A	7	1	0,006989	-
PRM2	rs4781055	11369428	downstream	C -> T	109,2	9	0,154553	-
PRM2	rs424908	11369534	UTR3	G -> A	222	49	0,967053	-
PRM2	rs74007625	11369938	exonic	G -> A	125	27	0,028954	nonsyn.	P97L
PRM2	rs74007626	11369947	exonic	G -> A	139	27	0,028954	nonsyn.	A94V
PRM1	rs737008	11374866	exonic	G -> T	222	38	0,487819	Synonim.	R47R	1
PRM1	rs74007629	11375209	upstream	G -> A	87	9	0,007388	-
PRM1,RMI2	rs74731751	11376499	intergenic	C -> T	4,8	1	0,007588	-
PRM1,RMI2	rs55707838	11378075	intergenic	C -> T	11,3	1	0,155351	-
PRM1,RMI2	rs11074957	11378151	intergenic	G -> A	7,8	1	0,480232	-
PRM1,RMI2	-	11391899	intergenic	G -> T	11,3	1	-	-
PRM1,RMI2	rs7206320	11393685	intergenic	A -> G	10,4	1	0,684904	-
PRM1,RMI2	rs55726383	11394552	intergenic	C -> A	10,4	1	0,011981	-
PRM1,RMI2	-	11394652	intergenic	G -> T	7	1	-	-
PRM1,RMI2	rs77305343	11400991	intergenic	A -> C	8,6	1	0,011182	-
PRM1,RMI2	rs7190580	11403470	intergenic	A -> G	4,8	1	0,783946	-
PRM1,RMI2	rs1345878	11404753	intergenic	A -> G	6,2	1	0,769169	-
PRM1,RMI2	rs74007667	11409945	intergenic	C -> T	11,3	1	0,006789	-
PRM1,RMI2	rs9927945	11412772	intergenic	T -> C	7,8	1	0,969649	-
PRM1,RMI2	rs9302459	11420339	intergenic	G -> T	7,8	1	0,805112	-
PRM1,RMI2	-	11420402	intergenic	G -> T	5,5	1	-	-
PRM1,RMI2	rs8049090	11421095	intergenic	G -> A	19,8	2	0,373403	-
PRM1,RMI2	rs4390613	11422836	intergenic	T -> C	9,5	1	0,807708	-
PRM1,RMI2	rs370573625	11429529	intergenic	C -> T	4,8	1	0,186102	-
PRM1,RMI2	rs9922790	11435422	intergenic	T -> G	10,4	1	0,96865	-
PRM1,RMI2	rs11645404	11436629	intergenic	G -> A	11,3	1	0,184505	-
RMI2	rs12149160	11439303	UTR5	G -> T	32,8	2	0,360623	-
RMI2	rs918737	11439639	intronic	T -> C	15,9	2	0,510982	-
RMI2	rs74010208	11439665	intronic	C -> G	3,5	2	0,004992	-
RMI2	rs918738	11439679	intronic	C -> G	44,8	2	0,377596	-
RMI2	rs7184280	11441012	intronic	A -> G	7	1	0,96905	-
RMI2	rs13331623	11441498	intronic	T -> C	11,3	1	0,471645	-
RMI2	rs7189044	11442196	intronic	G -> C	3,5	2	0,213458	-
RMI2	rs7191093	11442279	intronic	A -> G	5,5	1	0,178115	-
RMI2	rs2032929	11444403	intronic	T -> C	177	27	0,886382	-
RMI2	rs28627609	11444425	intronic	C -> T	61	25	0,213259	-
RMI2	rs2032930	11444430	intronic	T -> G	222	30	0,887181	-
RMI2	-	11444454	intronic	* ->	10,8	55	-	-
RMI2	rs2032931	11444469	intronic	C -> T	222	92	0,873602	-
RMI2	rs7204628	11444572	exonic	A -> C	225	113	0,178115	synonim.	T123T
RMI2	rs6498185	11444726	UTR3	C -> T	72	26	0,172324	-
RMI2	rs2032933	11445040	UTR3	G -> A	11,3	1	0,885982	-
PRSS53	rs11865038	31095171	intronic	C -> T	222	53	0,479233	-		2
PRSS53	rs11864806	31095204	intronic	G -> C	222	37	0,479034	-
PRSS53	rs11864839	31095251	intronic	G -> C	124	31	0,471446	-
PRSS53	rs7199949	31096164	exonic	G -> C	148,1	7	0,479034	nonsyn.	P406A
PRSS53	-	31097046	intronic	G -> T	11,3	1	-	-
PRSS53	rs4889535	31097574	intronic	G -> C	73	3	0,983027	-
PRSS53	rs74015064	31098223	intronic	G -> A	11,3	8	0,006989	-
PRSS53	rs6565218	31098582	intronic	G -> T	109,1	8	0,984026	-
PRSS53	rs73530203	31099859	intronic	G -> A	22	4	0,351438	-
HERPUD1	-	56965947	upstream	G -> T	4,1	3	-	-
HERPUD1	rs37025	56966011	UTR5	G -> A	53	5	0,758786	-
HERPUD1	rs37024	56966071	UTR5	T -> G	49	4	0,609026	-
HERPUD1	-	56968938	intronic	C -> A	3,5	3	-	-
HERPUD1	rs2217332	56969148	exonic	G -> A	225	80	0,148762	nonsyn.	R50H	3

* - Индель: "gaaaaaaaaaaa - > gaaaaaaaaaa,gaaaaaaaaa"
1. - Фенотип: черты, присущие ожиреню
2. - Фенотип: Болезнь Паркинсона
3. - Фенотип: Метаболический синдром

Главнaя страница