Bedtools

Программа Что делает
bedtools bamtobed -i chr13.1.sorted.bam > chr13.1.bed

Исходный файл

Файл с результатом

Преобразует bam-файл из предыдущего практикума (с выровненными прочтениями) в bed-файл
bedtools intersect -a /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed -b chr13.1.bed -u > intersect.out6

Исходный файл

Файл с результатом

Ищет пересечения полученного на предыдущем шаге bed-файла с референсной разметкой генома -a - это последовательность, для которой ищем пересечения с b, -u выдаёт только строки, имеющие ненулевое пересечение *
bedtools bamtofastq -i chr13.1.bam -fq chr13.1.converted.fastq

Исходный файл

Файл с результатом

Конвертирует bam-файл в файл формата fastq
bedtools getfasta -fi ../chr13.fasta -bed sno_gene.bed > sno_gene.fasta

Исходный файл

Файл с результатом

По координатам в bed-файле выдаёт последовательность в формате fasta
bedtools makewindows -g hg19.chr13 -w 1000000 > chr13_intervals.bed

Файл с результатом

Зная длину хромосомы в данной сборке (-g - файл с длинами хромосами), разбивает её на участки опредлённой длины (в данном случае 1 млн. нуклеотидов, длина "окна" задаётся опцией -w) и создаёт bed-файл c этими участками

*В итоге в пересечение попали гены SNORA31 (6 раз), TPT1 (128 раз), RP11-290D2.6 (4 раза) и TPT1-AS1 (11 раз).

SNORA31 - ген малой ядрышковой РНК. Координаты на хромосоме 13: 45337480-45337609, обратная цепь. 1 вариант транскрипта (нет альтернативного сплайсинга).

TPT1 - белок-кодирующий ген, в ENSEMBL описывается как опухолевый белок (tumor protein), синонимичный фортилину TCTP. Координаты на хромосоме 13: 45333471-45341370, обратная цепь. Имеет 14 альтернативных транскриптов. Основной транскрипт содержит 6 экзонов, 5 интронов (по данным UCSC).

TPT1-AS1 - это антисмысловая РНК TPT1 (видимо, просто побочный транскрипт с другой цепочки).

RP11-290D2 - регион хромосомы 13 с координатами 45194220-45355516, антисмысловой.


© Быкова Даша, 2018