Работа с пакетом BEDTOOLS

1. Обязательная часть

Команда (со всеми параметрами) Описание (что делает)
bedtools bamtobed -i chr15_bin.sorted.bam > chr15_sorted.bed смена формат отсортированного файла с выравниванием (.bam) в .bed( -i - указывает на имя файла, формат которого мы меняем)
bedtools intersect -u -wa -a /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed -b chr15_sorted.bed > intersect.bed пересечение чтений и последовательности (без глубины)
Все гены, задетые перекрыванием:
ALDH1A2 aldehyde dehydrogenase 1 family member A2 [ Homo sapiens (human) ]
LIPC lipase C, hepatic type [ Homo sapiens (human) ]
ACAN aggrecan [ Homo sapiens (human) ]
HMG20A high mobility group 20A [ Homo sapiens (human) ]
Команда (со всеми параметрами) Описание (что делает)
bedtools intersect -a /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed -b chr15_sorted.bed -wa -wb > oneread.bed Опция -wa -wb записывает в файл oneread.bed таким образом, что одна строка соответствует одному покрытию ридом
bedtools coverage -a /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed -b chr15_sorted.bed | grep -r "chr15" > chr15_covered.bed подсчет покрытия разметки нашими ридами + удаление лишнего, кроме нужной хромосомы
sort -u chr15_covered.bed > chr15_covered_new.bed удаление повторов
grep -v "0.0000000" chr15_covered_new.bed > chr15_finish.bed отделение ненулевых покрытий

Таблица генов

Ген Полное имя Организм Доп. названия Эксп. Размер Координаты Функция белка
ALDH1A2 ALDH1A2 aldehyde dehydrogenase 1 family member A2 Homo sapiens RALDH2; RALDH2-T; RALDH(II) 390449 - 544443 58245622 ... 58790065 Этот белок относится к семейству белков альдегиддегидрогеназы. Продукт этого гена представляет собой фермент, который катализирует синтез ретиноевой кислоты (RA) из ретинальдегида. Ретиноевая кислота, активное производное витамина А (ретинол), является гормональной сигнальной молекулой, которая функционирует в развивающихся и взрослых тканях. Исследования сходного гена мыши позволяют предположить, что этот фермент и цитохром CYP26A1 одновременно устанавливают локальные уровни эмбриональной ретиноевой кислоты, которые способствуют развитию заднего органа и предотвращают расщепление позвоночника. Для этого гена были идентифицированы четыре варианта транскрипта, кодирующих разные изоформы.
LIPC lipase C, hepatic type Homo sapiens HL; HTGL; LIPH; HDLCQ12 2 - 158383 58702768 ... 58856207 LIPC кодирует печеночную триглицеридную липазу, которая экспрессируется в печени. LIPC выполняет двойную функцию триглицеридгидролазы и лиганд / мостикового фактора для рецептор-опосредованного поглощения липопротеинов
HMG20A high mobility group 20A Homo sapiens HMGX1; HMGXB1 2 - 12729 77712754 ... 77777949 -
ACAN aggrecan Homo sapiens AGC1; SEDK; AGCAN; CSPG1; MSK16; CSPGCP; SSOAOD 2 - 71911 89346674 ... 89394752 Кодируемый белок является неотъемлемой частью внеклеточного матрикса в хрящевой ткани и выдерживает сжатие в хряще. Мутации в этом гене могут быть вовлечены в дисплазию скелета и дегенерацию позвоночника. В этом гене были обнаружены несколько альтернативно сплайсированных вариантов транскрипта, которые кодируют разные изоформы белка

2. Дополнительные задания

номер задания задание команда
1 Получите из файла c выравниванием файл с чтениями в формате fastq bedtools bamtofastq -i input.bam -fq output.fastq
4 Объедините Ваши чтения в кластеры (используйте bed файл с выровненными чтениями из Обязательной части задания) bedtools cluster -i chr15_sorted.bed -s > cluster.bed
5 Наберите из Вашей хромосомы 1000 случайных фрагментов по 200 нуклеотидов /P/y14/term3/block4/SNP/bedtools2/bin/bedtools random -l 200 -n 1000 -g chr15.fasta >> random_chr15.bed

© Grigorjeva Masha