Анализ транскриптомов

Анализ качества и картирование чтений

Исходные чтения

очищенные чтения

Команда Функция
java -jar /nfs/srv/databases/ngs/bezvita/Trimmomatic-0.38/trimmomatic-0.38.jar SE -phred33 chr6.1.fastq chr6.1_tri.fastq TRAILING:20 MINLEN:50 Очистка чтений
hisat2 -x file -U chr6.1_tri.fastq --no-softclip > align.sam Построение выравнивания прочтений и референса в формате .sam
samtools view align.sam -bo align.bam Перевод выравнивания чтений с референсом в бинарный формат .bam
samtools sort align.bam -o sorted.bam > sorted.bam Сортировка выравнивания чтений с референсом по координате в референсе начала чтения
Картирование:
53819 reads; of these:
  53819 (100.00%) were unpaired; of these:
    9378 (17.43%) aligned 0 times
    44441 (82.57%) aligned exactly 1 time
    0 (0.00%) aligned >1 times
82.57% overall alignment rate

Подсчет чтений

htseq-count -f 'bam' -s 'no' -i 'gene_id' -m 'union' sorted.bam /P/y14/term3/block4/SNP/rnaseq_reads/gencode.v19.chr_patch_hapl_scaff.annotation.gtf >> count_out

__no_feature 175

__ambiguous 0

__too_low_aQual 0

__not_aligned 9378

__alignment_not_unique 0

Ген: ENSG00000156508.13 (eukaryotic translation elongation factor 1 alpha 1), 44266 чтения легли на него

Опции:

-f - Формат файла выравнивания: .bam или .sam

-s - Направление цепи: прямое, обратное, нет направления

-i - Атрибут GFF как feature ID

-m - Режим обработки считывания, перекрывающий более чем одну особенность

44422 чтения легли в границы генов. 9378 - не легли