Практикум 13

Задача: какие гены и насколько глубоко оказались покрыты чтениями, которые Вы анализировали в Практикуме 12. Опишите эти гены: размер, координаты, функция, количество экзонов и интронов, направление, любая дополнительная информация.


Файл с разметкой генов по версии Gencode для генома человека сборки hg19 лежит тут: /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed
Программа bedtools лежит тут: /P/y14/term3/block4/SNP/bedtools2/bin
Пример запуска: /P/y14/term3/block4/SNP/bedtools2/bin/bedtools intersect -h
Подсказка: предлагается из файла с выравниваем достать координаты каждого выровненного чтения (.bed), а затем пересечь эти координаты с разметкой генов.
Подумайте, в каком порядке пересекать файлы и какую опцию стоит добавить, чтобы сразу посчитать количество чтений.

Первым делом нужно перевести файл из формата .bam в формат .bed

Команда:/P/y14/term3/block4/SNP/bedtools2/bin/bedtools bamtobed -i chr21sort.1.bam > chr21.1.bed

Далее воспользуемся командой intersect

Команда: /P/y14/term3/block4/SNP/bedtools2/bin/bedtools intersect -a chr21sort.1.bed -b /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed

Таким образом были найдены 2 гена: Usp16 и Cct8.

Usp16:
Ubiquitin carboxyl-terminal hydrolase 16 is an enzyme that in humans is encoded by the USP16 gene.
Координаты: 30,396,950-30,426,809
Длина:29,859
Экзоны:20

Ссt8:
T-complex protein 1 subunit theta is a protein that in humans is encoded by the CCT8 gene.
Координаты: 30,428,126-30,446,118
Длина: 17,992
Экзоны:16

Гены вошли не целиком, хотя по расчетам должны были. Возможно дело в сплайсинге.

Дополнительные задачи

1. Получите из файла в выравниванием файл с чтениями в формате fastq

Команда: bedtools bamtofastq -i chr21sort.1.bam -fq chr21.1.fq

2. Наберите из Вашей хромосомы 1000 случайных фрагментов по 200 нуклеотидов.

Команда: bedtools random -g chr21.txt -n 1000 -l 200 > chr21random.bed

3. Получите непересекающиеся фрагменты, соответствующие области, покрытой Вашими чтениями (используйте bed файл с выровненными чтениями из Обязательной части задания).

Команда: bedtools getfasta -fi chr21.fasta -bed chr21sort.1.bed > chr21gene.fasta


© Cherkashina Anastasia 2017