Bedtools

Покрыто всего три гена :

ENSG00000076108.7	9        BAZ2A   Transcription termination factor I-interacting protein 5
ENSG00000110955.4	15189    ATP5B   АТФ синтаза, бета субъединица
ENSG00000207031.1	8        SNORD59A Малая ядрышковая РНК
	
Самый покрытый ген - ген каталитической субъединицы АТФ синтазы, которая вместе вместе с альфа субъединицей образует гексамер, который и катализирует синтез АТФ из АДФ.

Использованные команды: 1) Получение bed файла из bam выравнивания:

bedtools bamtobed -i sorted_chr12.1.bam > chr12.1.bed
	
2) Получение покрытых генов с обозначением покрытия (пересечение считалось при покрытии больше 1 bp:
bedtools intersect -c -a /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed \
-b chr12.1.bed | grep -vE '\s0$' > covered_genes.bed
	
Во входном файле одному гену соответствует несколько фич. Не совсем понятно, по какому принципу.

Табл. 1. Характеристики генов
BAZ2A ATP5B SNORD59
Размер, bp 41221 7840 75
Координаты, цепь Chr12:56,989,380-57,030,600; комплементарная Chr12:57,031,959-57,039,798; комплементарная Chr12: 57,038,811-57,038,885; комплементарная
Функция Регулятор хроматина и транскрипции Синтез АТФ 2'-O-метилирование 18S рРНК в позиции A1031
Экзоны, интроны 35, 34 10, 9 1, 0
Продукт 17 вариантов транскриптов, 9 вариантов белков от 116 до 1905 аа 11 транскриптов, 5 белков от 133 до 529 аа snoRNA 75 bp
Данные из gene ncbi, ensembl

Доп. задачи

Задание Исходные данные Команда Выход

BAM -> FASTQ

Файл выравнивания формата BAM
bedtools bamtofastq -i sorted_chr12.1.bam -fq new_fastq.fastq
	    
FASTQ с чтениями

FASTA одного из генов

BED с координатами гена, FASTA с полной последовательностью
bedtools getfasta -fi ../chr12.fasta -bed \
the_one_choosen_gene.bed -fo the_one_choosen_gene_seq.fasta
	    
FASTA, последовательность гена

Кластеризация чтений (-s для привязки кластера к конкретной цепи)

BED с координатами ридов
bedtools cluster -i chr12.1.bed -s > clusters.bed
	    

BED с ридами, добавлен столбец с id кластера. Всего 19 кластеров. 13 кластер похож на ATP5B.


© Бушмакин Илья, 2017