Команда | Функция |
hisat2-build chr10.fasta chr10 | Выдаёт индексированную референсную последовательность в формате fasta |
hisat2 -x chr10 -U chr10.fastq --no-softclip > align.sam | Выравнивает прочтения с референсной последовательностью |
samtools view align.sam -b -o align.bam | переводит файл из формата sam в формат bam |
samtools sort align.bam -T file.txt -o alignsort.bam | Сортирует выравнивание чтений |
samtools idxstats alignsort.bam > resut.txt | записывает число закартированных чтений |
В результате было откартировано 15108 чтений. 205 чтение не откартировалось.
Из второй команды я убрал параметр --no-spliced-alignment, так как часть РНК уже потеряло интроны.
Команда | Функция |
/P/y14/term3/block4/SNP/bedtools2/bin/bedtools bamtobed -i alignsort1.bam > chr10_1.bed | Создает файл в .bed формате |
/P/y14/term3/block4/SNP/bedtools2/bin/bedtools intersect -c -a /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed -b chr10.bed > chr10_c_rev.bed | Создается файл, где со списком генов идут их покрытия |
/P/y14/term3/block4/SNP/bedtools2/bin/bedtools intersect -a /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed -b chr10.bed -u > chr10_u_rev.bed | Создается файл, содержащий строки лишь с генами, имеющими ненулевое покрытие |
/P/y14/term3/block4/SNP/bedtools2/bin/bedtools intersect -wa -wb -a chr10.bed -b /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed > chr10_1_wa_wb.bed | Создается файл, где любые перекрывающиеся участки выводятся одной строкой, содержащей названия этих участков в файле chr10.bed и в разметке соответственно |