Bedtools


bedtools bamtobed -i out.bam >> reads.bed
Переводит файл out.bam из формата .bam в формат .bed (выходной файл - reads.bed)
Опция -i обозначает, что
 bedtools intersect -c -a /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed -b reads.bed > intersect.bed
Ищет пересечения ридов с разметкой генов , считает их количество и записывает это в файл intersect.bed
 grep -r "chr20" intersect.bed > intersect2.bedexit
Записывает в файл intersect2.bed только пересечения с разметкой генов 20-й хромосомой.
grep -v "0$" intersect2.bed > intersect3.bed
Записывает в файл intersect3.bed только ненулевые пересечения
 bedtools intersect -a /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed -b reads.bed -wa -wb > oneread.bed 
Опция -wa -wb записывает в файл oneread.bed таким образом, что одна строка соответствует одному покрытию ридом
 bedtools coverage -a /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed -b reads.bed | grep -r "chr20" > chr20cov.bed
Считает покрытие разметки нашими ридами, удаляем всё, кроме хромосомы 20
sort -u chr20cov.bed > sorted.bed
Удаляет все повторы и записывает жто в файл sorted.bed
grep -v "0.0000000" sorted.bed > sorted2.bed
Записывает все строки с ненулевыми покрытиями в файл sorted2.bed

Таблица с покрытиями генов
Краткая сводка по генам, которые оказались покрыты ридами:
ГенНаправлениеКоординаты(hg19)Функция продуктаКоличество экзонов
UQCC1complement33890369..33999945ubiquinol-cytochrome c reductase complex assembly factor 112
GDF5complement34021149..34026027growth differentiation factor 54
SPATA2 complement48519928..48532080spermatogenesis associated 25
ZBP1complement56178902..56195632Z-DNA binding protein 113

Дополнительные задания
bedtools bamtofastq -i chr20.bam -fq chr20bedtofastq.fastq
Переводит файл с выравниваем(из практикума 12) из формата .bam в формат .fastq
 bedtools getfasta -name -fi chr20.fasta -bed uqcc1.bed > getfasta.bed
Вырезает из файла с последовательностью хромосомы участок с координатами, которые записаны в файле uqcc1.bed (содержит координаты гена ugcc1(hg19)).
bedtools cluster -i reads.bed -s -d 10 > cluster.bed
Объединяет наши риды в кластеры с максимальным расстроянием в 10 п.о по одной цепи


©Кондратенко Наталья, 2017