Исходные чтения
очищенные чтения
Команда | Функция |
---|---|
java -jar /nfs/srv/databases/ngs/bezvita/Trimmomatic-0.38/trimmomatic-0.38.jar SE -phred33 chr6.1.fastq chr6.1_tri.fastq TRAILING:20 MINLEN:50 | Очистка чтений |
hisat2 -x file -U chr6.1_tri.fastq --no-softclip > align.sam | Построение выравнивания прочтений и референса в формате .sam |
samtools view align.sam -bo align.bam | Перевод выравнивания чтений с референсом в бинарный формат .bam |
samtools sort align.bam -o sorted.bam > sorted.bam | Сортировка выравнивания чтений с референсом по координате в референсе начала чтения |
Картирование: 53819 reads; of these: 53819 (100.00%) were unpaired; of these: 9378 (17.43%) aligned 0 times 44441 (82.57%) aligned exactly 1 time 0 (0.00%) aligned >1 times 82.57% overall alignment rate
htseq-count -f 'bam' -s 'no' -i 'gene_id' -m 'union' sorted.bam /P/y14/term3/block4/SNP/rnaseq_reads/gencode.v19.chr_patch_hapl_scaff.annotation.gtf >> count_out
__no_feature 175
__ambiguous 0
__too_low_aQual 0
__not_aligned 9378
__alignment_not_unique 0
Ген: ENSG00000156508.13 (eukaryotic translation elongation factor 1 alpha 1), 44266 чтения легли на него
Опции:
-f - Формат файла выравнивания: .bam или .sam
-s - Направление цепи: прямое, обратное, нет направления
-i - Атрибут GFF как feature ID
-m - Режим обработки считывания, перекрывающий более чем одну особенность
44422 чтения легли в границы генов. 9378 - не легли