hisat2-build chr5.fasta rupd | Индексирует референс |
---|---|
fastqc chr5.fastq | Анализирует качества секвенирования, выдает zip-архив и html-отчет |
java -jar /nfs/srv/databases/ngs/suvorova/trimmomatic/trimmomatic-0.30.jar SE -phred33 chr5.fastq chr5_trimmed.fastq TRAILING:20 MINLEN:50 | Очищает чтения |
fastqc chr5_trimmed.fastq | Проверяет качество после очистки чтений |
PATH=$PATH:/home/students/y06/anastaisha_w/hisat2-2.0.5 | Позволяет bash искать исполняемые файлы в указанной директории |
hisat2 -x rupd -U chr5_trimmed.fastq -S chr5_align.sam --no-softclip --no-spliced-alignment | Выравнивает прочтения и референсы |
samtools view -b chr5_align.sam -o chr5_align.bam | Переводит выравнивания в бинарный формат |
samtools sort chr5_align.bam chr5_align_sorted | Сортирует выравнивания по координате в референсе |
samtools index chr5_align_sorted.bam | Индексирует отсортированный файл |
samtools flagstat chr5_align.sam | Получениет основную информацию о картировании, в т.ч. числе откартированных чтений |
samtools mpileup -uf chr5.fasta chr5_align_sorted.bam -o chr5_snp.bcf | Создаёт файл с полиморфизмами |
bcftools call -cv chr5_snp.bcf -o chr5_snp.vcf | Переводит полученный файл в текстовый формат |
vcftools --vcf chr5_snp.vcf --remove-indels --recode --out chr5_snp_noind | Удаляет индели из vcf-файла |
convert2annovar.pl -format vcf4 chr5_snp_noind.recode.vcf -outfile chr5_snp.avinput | Получает входной файла для annovar |
annotate_variation.pl -out chr5_refgene -build hg19 chr5_snp.avinput /nfs/srv/databases/annovar/humandb.old/ | Аннотация по базе данных refGene |
annotate_variation.pl -filter -out chr5_dbsnp -build hg19 -dbtype snp138 chr5_snp.avinput /nfs/srv/databases/annovar/humandb.old/ | Аннотация по базе данных dbsnp |
annotate_variation.pl -filter -dbtype 1000g2014oct_all -buildver hg19 -out chr5_1000genomes chr5_snp.avinput /nfs/srv/databases/annovar/humandb.old/ | Аннотация по базе данных 1000 genomes |
annotate_variation.pl -regionanno -build hg19 -out chr5_gwas -dbtype gwasCatalog chr5_snp.avinput /nfs/srv/databases/annovar/humandb.old/ | Аннотация по базе данных Gwas |
annotate_variation.pl chr5_snp.avinput /nfs/srv/databases/annovar/humandb.old/ -filter -dbtype clinvar_20150629 -buildver hg19 -out chr5_clinvar | Аннотация по базе данных Clinvar |
До триммирования
Последовательностей: 8208
После триммирования
Последовательностей: 8114
Триммирование оправдано. Выбросов стало меньше.
8114 reads; of these: 8114 (100.00%) were unpaired; of these: 30 (0.37%) aligned 0 times 8084 (99.63%) aligned exactly 1 time 0 (0.00%) aligned >1 times 99.63% overall alignment rate