Bedtools

Обязательная часть

команда функция
/P/y14/term3/block4/SNP/bedtools2/bin/bedtools bamtobed -i 14.1_alignsort.bam > reads.bed Перевод .bam-файла в .bed-файл
/P/y14/term3/block4/SNP/bedtools2/bin/bedtools intersect -a gencode.genes.bed -b reads.bed -c> GenIntRead Пересечение ридов с генной разметкой ( параметр "-с" был указан, чтобы в каждой каждой разметки в gencode.genes.bed было указано количество пересечений с reads.bed)

Чтобы получить только гены, которые пересекаются более одного раза с разметкой был проделано следующие:

команда функция
/P/y14/term3/block4/SNP/bedtools2/bin/bedtools intersect -a gencode.genes.bed -b reads.bed -u> GenIntRead1 были получены гены, пересечение с ридоми которых не менее 1 (параметр "-u")
/P/y14/term3/block4/SNP/bedtools2/bin/bedtools intersect -a GenIntRead1 -b reads.bed -c> GenIntRead3 Пеересечение ридов с генной разметкой, при условии, что пересечение не менее 1

Из файлы были выбраны 3 гена, имеющие достаточно количество перечечений. Информация о гене была получена из Genome Browser Gateway.

размер координаты функция количество экзонов направление
RNASE9 chr14:21,024,252-21,029,090 человеческая рибонуклеаза 5 обратное
TSHR chr14:81,421,869-81,574,828 человеческий рецептор тиреотропного гормона 8 прямое
PPP2R5C chr14:102,228,135-102,302,909 человеческая фосфотаза 5 прямое

Дополнительные задачи

1. Получите из файла в выравниванием файл с чтениями в формате fastq

/P/y14/term3/block4/SNP/bedtools2/bin/bedtools bamtofastq -i 14.1_align.bam -fq 1.fastaq

2. Получите файл с нуклеотидной последовательностью (.fasta) для одного из покрытых Вашими чтениями генов.

/P/y14/term3/block4/SNP/bedtools2/bin/bedtools getfasta -bed r.bed -fi chr14.fasta > 4.fasta

входной файл: r.bed , chr14.fasta

выходной файл: 4.fasta

4. Объедините Ваши чтения в кластеры (используйте bed файл с выровненными чтениями из Обязательной части задания)

/P/y14/term3/block4/SNP/bedtools2/bin/bedtools cluster -i reads.bed > clusters.bed

входной файл: reads.bed

выходной файл: clusters.bed

Всего получилось 318 кластеров.