Bedtools

Информация о гене SNRPB:

Ген SNRPB кодирует малые ядерные рибонуклеопротеин-ассоциированные белки B и B', которые играют роль в сплайсинге.
Расположен на обратной цепи 20 хромосомы, координаты: 2,461,634-2,470,853.
Длина составляет 9,220 пар оснований.
Покрытие составило 57690, уникальное покрытие составило 25357.

Информация о гене SNORD119:

Ген SNORD119 кодирует малые ядрышковые РНК (мякРНК) — класс малых РНК, участвующих в метилировании и псевдоуридилировании рибосомных РНК, а также тРНК и малых ядерных РНК.
Расположен на обратной цепи 20 хромосомы, координаты: 2,443,608-2,443,683. Длина составляет 75 пар оснований.
Покрытие составило 405, уникальное покрытие составило 135.

Команды
bedtools bamtobed -i sort.bam > chr20.1.bed Перевод формата .bam в .bed, -i input
/P/y14/term3/block4/SNP/bedtools2/bin/bedtools intersect -c –a /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed -b chr20.1.bed > intsect.bed Вывод перекрытия между референсом (-a) и ридами (-b). Опция -c Write the original A entry _once_ if _any_ overlaps found in B. Есть глубина покрытия
grep -w -v 0 intsect.bed > intsect_0.bed Создание отдельный файл строки с нулевым значением
/P/y14/term3/block4/SNP/bedtools2/bin/bedtools intersect -u –a /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed -b chr20.1.bed > ovlp.bed Вывод перекрытия между референсом (-a) и ридами (-b). Опция -u выдаёт только строки c ненулевым пересечением. Нет глубины покрытия.

Дополнительные задачи

Команда Описание
bedtools bamtofastq -i chr20.bam -fq chr20.fastq Переводит файл с выравниваем из формата .bam в формат .fastq
bedtools random -g chr20.fasta -l 200 -n 1000 > random.bed Наберает из хромосомы 1000 случайных фрагментов по 200 нуклеотидов.
bedtools cluster -i 3reads.bed -s -d 10 > cluster.bed Объединяет риды в кластеры (макс расстрояние 10 п.о по одной цепи)

Вернуться на главную страницу


© Наумова Юлия, 2018