Bedtools

Обязательная часть


В данном задании был использован файл chr21_sort.bam с выравниванием чтений с референсом из 12 практикума
Input OutputКомандаОписание
chr21_sort.bamsort.bed
bedtools bamtobed -i chr21_sort.bam > sort.bed
Перевод в bed формат
sort.bedout.bed
 bedtools intersect -a gencode.genes.bed -b sort.bed -c |grep -r "^chr21" | grep -r -v "0$" > out.bed
Пересекает чтения с геномом, далее отбирает строки с chr21 и ненулевым покрытием

Информация о генах


Часть информации была взята из результатов выполнения указанных выше команд,
а часть из NCBI
ГенКоординатыНаправлениеФункцияЭкзоныЧтенияРазмерИнтроны
USP16NC_000021.8 (30396938..30426809) 21q21.3прямоеубиквитин карбоксил-терминальная гидролаза 16201112987118
CCT8NC_000021.8 (30428647..30446010) 21q21.3обратноекодирующий шаперонин, содержащий субъединицу TCP1 816107481736314

Дополнительные задания

Номер заданияКомандаВходной файлВыходной файлОписание
1.Получите из файла в выравниванием файл с чтениями в формате fastq
bedtools bamtofastq -i chr21_sort.bam -fq chr21_all.fq
chr21_sort.bamchr21_all.fqПереводит выравнивания в формат fastq
2.Получите файл с нуклеотидной последовательностью (.fasta) для одного из покрытых Вашими чтениями генов
 bedtools getfasta -fi chr21.fasta -bed gene.bed>gene.fasta
chr21.fasta gene.bedgene.fastaВырезает последовательность гена
4.Объедините Ваши чтения в кластеры (используйте bed файл с выровненными чтениями из Обязательной части задания)
 bedtools cluster -i sort.bed -s -d 40 > cluster.bed
sort.bedcluster.bedОбъединяет чтения на одной цепи на расстоянии меньше 40 bp в кластеры(20)
10.Получите файл с координатами интервалов, покрытых Вашими чтениями, с информацией о покрытии в любом формате
 bedtools genomecov -ibam chr21_sort.bam -bg>out_10.bam
chr21_sort.bamout_10.bamКоординаты интервалов с информации о покрытии

© Simon Konnov 2017