Input | Output | Программа | Что делает |
chr10.1_sort.bam | alin.bed | bedtools bamtobed -i chr10.1_sort.bam > alin.bed |
Переводим файл с выравниванием в формате .bam в формат, удобный для работы bedtools - .bed |
alin.bed | sorted.int.chr10.bed | bedtools intersect -a /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed -b alin.bed -c > intersect.bed |
Получаем пересечение наших чтений с последовательностью генома (по координатам), для каждой хромосомы; далее отбираем строки с интересующими нас данными - chr10, с покрытием более 0 |
alin.bed | u.genes.bed | bedtools intersect -a /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed -b alin.bed -u > u.genes.bed | Практически то же самое, но число находок больше в сравнении с предыдущим способом; не выводится глубина покрытия |
alin.bed | wawb.bed | bedtools intersect -a /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed -b alin.bed -wa -wb > wawb.bed |
Каждое перекрывание выписывается в output одной строкой; |
gencode.genes.bed, alin.bed | cover.bed | bedtools coverage -a /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed -b alin.bed | grep -r "^chr10" > cover.bed |
Определяем покрытие разметки нашими ридами |
Ген | Цепь | Положение в геноме | Продукт | Покрытие (без удаления дубликатов) | Покрытие (с удалением дубликатов | Экзоны | Полное название | Функция |
DDX21 | - | NC_000010.11 (68956123..68985069) | protein_coding DEAD box protein |
63228 | 22 | 16 | DExD-box helicase 21 | Этот ген кодирует белок DEAD box, который является антигеном, распознаваемым аутоиммунными антителами пациента с болезнью watermelon stomach disease. Этот белок разматывает двухцепочечную РНК, складывает одноцепочечную РНК и может играть важную роль в биогенезе рибосомальной РНК, редактировании РНК, транспорте РНК и общей транскрипции. |
RN7SL373P | - | misc_RNA | 501 | 1 | На NCBI и Ensembl записей не найдено |