Bedtools

Основное задание

Команды:

/P/y14/term3/block4/SNP/bedtools2/bin/bedtools bamtobed -i virs.bam > chr14_1.bed

Функция - создание файла в формате .bed

bedtools intersect -a /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed -b chr14_1.bed -c | grep -r "^chr14" | grep -w -v 0 > itogo.bed

Функция - нахождение пересечение генома с выравниванием ридов. Команда оставляет только те, которые относятся к 14 хромосоме, при этом остаются тоько те пересечения, покрытие которых не равно нулю. Покрытие сразу получается путём использования параметра -с.

В конечном итоге выявился только один ген - HSP90AA1. Его покрытие составляет 271945. Полное имя - heat shock protein 90 alpha family class A member 1. Располодение - 14q32.31. Число экзонов - 13, интронов - 12. Координаты - 102080738..102139749. Ген расположен на обратной цепи. Размер гена составляет 59 012 пар оснований.

Белок, кодируемый этим геном, является индуцибельным молекулярным шапероном, который функционирует как гомодимер. Кодируемый белок способствует правильному сворачиванию специфических белков-мишеней с помощью АТФазной активности, которая модулируется ко-шаперонами.

Дополнительные задания

1. Получите из файла с выравниванием файл с чтениями в формате fastq

Команда:

/P/y14/term3/block4/SNP/bedtools2/bin/bedtools bamtofastq -i virs.bam -fq zadn.fq

2. Получите файл с нуклеотидной последовательностью (.fasta) для одного из покрытых Вашими чтениями генов.

Команда:

/P/y14/term3/block4/SNP/bedtools2/bin/bedtools getfasta -fi chr14.fasta -bed chrbed.bed > truch.fasta

В файле chrbed.bed записана строка: chr14 102552095 102552461 protein_coding HSP90AA1 3858

3. Разбейте свою хромосому на фрагменты по 1 млн нуклеотидов. Какова длина хромосомы в нуклеотидах? Сколько в результате получилось интервалов?

Команда: /P/y14/term3/block4/SNP/bedtools2/bin/bedtools makewindows -g chr14.gen -w 1000000 > dlina.bed

В файле chr14.gen была записана длина хромосомы - 107349660 пар оснований. После работы программы получилось 109 строк - тоесть 109 интервалов.


© Иззи Антон,2018