Практикум 13Задача: какие гены и насколько глубоко оказались покрыты чтениями, которые Вы анализировали в Практикуме 12. Опишите эти гены: размер, координаты, функция, количество экзонов и интронов, направление, любая дополнительная информация.Файл с разметкой генов по версии Gencode для генома человека сборки hg19 лежит тут: /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed Программа bedtools лежит тут: /P/y14/term3/block4/SNP/bedtools2/bin Пример запуска: /P/y14/term3/block4/SNP/bedtools2/bin/bedtools intersect -h Подсказка: предлагается из файла с выравниваем достать координаты каждого выровненного чтения (.bed), а затем пересечь эти координаты с разметкой генов. Подумайте, в каком порядке пересекать файлы и какую опцию стоит добавить, чтобы сразу посчитать количество чтений. Первым делом нужно перевести файл из формата .bam в формат .bed Команда:/P/y14/term3/block4/SNP/bedtools2/bin/bedtools bamtobed -i chr21sort.1.bam > chr21.1.bed Далее воспользуемся командой intersect Команда: /P/y14/term3/block4/SNP/bedtools2/bin/bedtools intersect -a chr21sort.1.bed -b /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed Таким образом были найдены 2 гена: Usp16 и Cct8. Usp16:
Ссt8:
Гены вошли не целиком, хотя по расчетам должны были. Возможно дело в сплайсинге. Дополнительные задачи1. Получите из файла в выравниванием файл с чтениями в формате fastq Команда: bedtools bamtofastq -i chr21sort.1.bam -fq chr21.1.fq 2. Наберите из Вашей хромосомы 1000 случайных фрагментов по 200 нуклеотидов. Команда: bedtools random -g chr21.txt -n 1000 -l 200 > chr21random.bed 3. Получите непересекающиеся фрагменты, соответствующие области, покрытой Вашими чтениями (используйте bed файл с выровненными чтениями из Обязательной части задания). Команда: bedtools getfasta -fi chr21.fasta -bed chr21sort.1.bed > chr21gene.fasta
|
|
© Cherkashina Anastasia 2017 |