Обязательная часть
Работал с файлом chr10_sorted.bam из прошлого практикума.
Перевод из .bam в .bed |
//P/y14/term3/block4/SNP/bedtools2/bin/bedtools bamtobed -i chr10_sorted.bam > chr10.bed |
Получение из генома, генов, хоть как-то задетых ридами |
//P/y14/term3/block4/SNP/bedtools2/bin/bedtools intersect -u -wa -a gencode.genes.bed -b chr10.bed > u_inter.bed |
В результате задетым оказался единственный ген - DDX21, тот же, что и был
обнаружен в предыпущем практикуме. (Так же есть небольшой кусочек гена RN7SL373P,
кодирующий РНК с неизвестной функцией). |
Определение покрытия гена DDX21 (Предварительно был создан bed файл
содержащий разметку, только для гена DDX21) |
//P/y14/term3/block4/SNP/bedtools2/bin/bedtools coverage -a ddx21.bed -b u_inter.bed |
Согласно выдаче:
- каждый участок гена покрыт минимум 4 раза;
- каждый участок покрыт полностью.
|
Информация о DDX21 |
Координаты | 70,715,879 - 70,744,825 |
Размер | 28,947 bp |
Направление | Прямое |
Экзоны | 15 (14) |
Интроны | 2 (3) |
Белок | Nucleolar RNA helicase 2 |
Функция | РНК хеликаза (я не знаю что тут ещё сказать) |
Дополнительные задачи
-
1. Получите из файла в выравниванием файл с чтениями в формате fastq.
bedtools bamtofastq -i input.bam -fq output.fastq
-
2. Получите файл с нуклеотидной последовательностью (.fasta) для одного из покрытых Вашими чтениями генов.
bedtools getfasta -fi input.fasta -bed coordinates.bed > output.fasta
-
5. Наберите из Вашей хромосомы 1000 случайных фрагментов по 200 нуклеотидов.
bedtools random -l 200 -n 1000 -g genome.fasta