Покрыто всего три гена :
ENSG00000076108.7 9 BAZ2A Transcription termination factor I-interacting protein 5 ENSG00000110955.4 15189 ATP5B АТФ синтаза, бета субъединица ENSG00000207031.1 8 SNORD59A Малая ядрышковая РНКСамый покрытый ген - ген каталитической субъединицы АТФ синтазы, которая вместе вместе с альфа субъединицей образует гексамер, который и катализирует синтез АТФ из АДФ.
Использованные команды: 1) Получение bed файла из bam выравнивания:
bedtools bamtobed -i sorted_chr12.1.bam > chr12.1.bed2) Получение покрытых генов с обозначением покрытия (пересечение считалось при покрытии больше 1 bp:
bedtools intersect -c -a /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed \ -b chr12.1.bed | grep -vE '\s0$' > covered_genes.bedВо входном файле одному гену соответствует несколько фич. Не совсем понятно, по какому принципу.
BAZ2A | ATP5B | SNORD59 | |
---|---|---|---|
Размер, bp | 41221 | 7840 | 75 |
Координаты, цепь | Chr12:56,989,380-57,030,600; комплементарная | Chr12:57,031,959-57,039,798; комплементарная | Chr12: 57,038,811-57,038,885; комплементарная |
Функция | Регулятор хроматина и транскрипции | Синтез АТФ | 2'-O-метилирование 18S рРНК в позиции A1031 |
Экзоны, интроны | 35, 34 | 10, 9 | 1, 0 |
Продукт | 17 вариантов транскриптов, 9 вариантов белков от 116 до 1905 аа | 11 транскриптов, 5 белков от 133 до 529 аа | snoRNA 75 bp |
Данные из gene ncbi, ensembl |
Доп. задачи
Задание | Исходные данные | Команда | Выход |
---|---|---|---|
BAM -> FASTQ |
Файл выравнивания формата BAM | bedtools bamtofastq -i sorted_chr12.1.bam -fq new_fastq.fastq |
FASTQ с чтениями |
FASTA одного из генов |
BED с координатами гена, FASTA с полной последовательностью | bedtools getfasta -fi ../chr12.fasta -bed \ the_one_choosen_gene.bed -fo the_one_choosen_gene_seq.fasta |
FASTA, последовательность гена |
Кластеризация чтений (-s для привязки кластера к конкретной цепи) |
BED с координатами ридов | bedtools cluster -i chr12.1.bed -s > clusters.bed |
BED с ридами, добавлен столбец с id кластера. Всего 19 кластеров. 13 кластер похож на ATP5B. |