Страница одиннадцатого практикума



Хромосома номер 5
hisat2-build chr5.fasta rupd Индексирует референс
fastqc chr5.fastq Анализирует качества секвенирования, выдает zip-архив и html-отчет
java -jar /nfs/srv/databases/ngs/suvorova/trimmomatic/trimmomatic-0.30.jar SE -phred33 chr5.fastq chr5_trimmed.fastq TRAILING:20 MINLEN:50 Очищает чтения
fastqc chr5_trimmed.fastq Проверяет качество после очистки чтений
PATH=$PATH:/home/students/y06/anastaisha_w/hisat2-2.0.5 Позволяет bash искать исполняемые файлы в указанной директории
hisat2 -x rupd -U chr5_trimmed.fastq -S chr5_align.sam --no-softclip --no-spliced-alignment Выравнивает прочтения и референсы
samtools view -b chr5_align.sam -o chr5_align.bam Переводит выравнивания в бинарный формат
samtools sort chr5_align.bam chr5_align_sorted Сортирует выравнивания по координате в референсе
samtools index chr5_align_sorted.bam Индексирует отсортированный файл
samtools flagstat chr5_align.sam Получениет основную информацию о картировании, в т.ч. числе откартированных чтений
samtools mpileup -uf chr5.fasta chr5_align_sorted.bam -o chr5_snp.bcf Создаёт файл с полиморфизмами
bcftools call -cv chr5_snp.bcf -o chr5_snp.vcf Переводит полученный файл в текстовый формат
vcftools --vcf chr5_snp.vcf --remove-indels --recode --out chr5_snp_noind Удаляет индели из vcf-файла
convert2annovar.pl -format vcf4 chr5_snp_noind.recode.vcf -outfile chr5_snp.avinput Получает входной файла для annovar
annotate_variation.pl -out chr5_refgene -build hg19 chr5_snp.avinput /nfs/srv/databases/annovar/humandb.old/ Аннотация по базе данных refGene
annotate_variation.pl -filter -out chr5_dbsnp -build hg19 -dbtype snp138 chr5_snp.avinput /nfs/srv/databases/annovar/humandb.old/ Аннотация по базе данных dbsnp
annotate_variation.pl -filter -dbtype 1000g2014oct_all -buildver hg19 -out chr5_1000genomes chr5_snp.avinput /nfs/srv/databases/annovar/humandb.old/ Аннотация по базе данных 1000 genomes
annotate_variation.pl -regionanno -build hg19 -out chr5_gwas -dbtype gwasCatalog chr5_snp.avinput /nfs/srv/databases/annovar/humandb.old/ Аннотация по базе данных Gwas
annotate_variation.pl chr5_snp.avinput /nfs/srv/databases/annovar/humandb.old/ -filter -dbtype clinvar_20150629 -buildver hg19 -out chr5_clinvar Аннотация по базе данных Clinvar

До триммирования
Последовательностей: 8208 g

После триммирования
Последовательностей: 8114
Триммирование оправдано. Выбросов стало меньше.
g


 8114 reads; of these:
  8114 (100.00%) were unpaired; of these:
    30 (0.37%) aligned 0 times
    8084 (99.63%) aligned exactly 1 time
    0 (0.00%) aligned >1 times
99.63% overall alignment rate

То есть картированы на геном были 99.63% последовательностей
Хорошо картировалось

Описание трёх полиморфизмов
Позиция - 3585717, земена G на C, качество - 221.999, глубина 113.
Позиция - 74639576, вставка, C/CAA, качество - 217.468, глубина 30.
Позиция - 7465223, делеция CAG/C, качество - 68.4664, глубина 9.

Всего 32 полиморфизма, из них 28 snp и 4 инделя.

Медианное качество полиморфизмов - 176,7335, среднее качество - 29.
Медианная глубина - 134,3642534, средняя глубина - 37,90625.

Из refgene.variant_function видим, что снп были разделены на категории: exonic (4) intronic (23) UTR3 (1)
Среди экзонных snp 3 попали в ген IL7R, а один - в ген CAPSL. Нуклеотидные замены: T197C (IL7R, exon2), G412A (IL7R, exon4), C731T (IL7R, exon6), G254A (CAPSL, exon3). Соответствующие им аминокислотные замены: I66T, V138I, T244I, R85Q.
24 snp имеют rs
По файлу 1000Genomes средняя частота snp - 0.42

Согласно базе данных ClinVar 2 полиморфизма в гене IL7R патогенны, приводят к иммунодеыициту, про ещё одинполиморфизм нет данных.
Согласно базе данных GWAS, три полиморфима приводят к повышению уровня липопротеинов низкой плотности, а другие два - к диабету I типа.