Часть II и III. Картирование чтений и анализ выравнивания.
Мы использовали индексированную хромосому из практикума 11.
Затем мы строили выравнивания прочтений и референса с помощью комманды:
hisat2 -x hisat2_index_base -U chr20.1.v3.fastq --no-softclip -S chr20pr12.sam
Мы убирали параметр --no-spliced-alignment, потому что это анализ транскриптома, и разрывы допустимы, так как в зрелой мРНК вырезаются интроны.
Далее переводим выравнивания из формата .sam в бинарный формат .bam с помощью команды
samtools view -b chr20pr12.sam >> chr20pr12.bam
Сортируем выравнивания по координате в референсе начала чтения:
samtools sort chr20pr12.bam pr12out
Индексируем отсортированный .bam файл:
samtools index pr12out.bam
Ридов откартировано на хромосому: 2498(все чтения откартированы).Все выровнены 1 раз.