Bedtools

Обязательная часть

Работал с файлом chr10_sorted.bam из прошлого практикума.

Перевод из .bam в .bed //P/y14/term3/block4/SNP/bedtools2/bin/bedtools bamtobed -i chr10_sorted.bam > chr10.bed
Получение из генома, генов, хоть как-то задетых ридами //P/y14/term3/block4/SNP/bedtools2/bin/bedtools intersect -u -wa -a gencode.genes.bed -b chr10.bed > u_inter.bed
В результате задетым оказался единственный ген - DDX21, тот же, что и был обнаружен в предыпущем практикуме. (Так же есть небольшой кусочек гена RN7SL373P, кодирующий РНК с неизвестной функцией).
Определение покрытия гена DDX21 (Предварительно был создан bed файл содержащий разметку, только для гена DDX21) //P/y14/term3/block4/SNP/bedtools2/bin/bedtools coverage -a ddx21.bed -b u_inter.bed
Согласно выдаче:
  • каждый участок гена покрыт минимум 4 раза;
  • каждый участок покрыт полностью.

Информация о DDX21
Координаты70,715,879 - 70,744,825
Размер28,947 bp
НаправлениеПрямое
Экзоны15 (14)
Интроны2 (3)
БелокNucleolar RNA helicase 2
ФункцияРНК хеликаза (я не знаю что тут ещё сказать)

Дополнительные задачи