Команда (со всеми параметрами) | Описание (что делает) |
bedtools bamtobed -i chr15_bin.sorted.bam > chr15_sorted.bed | смена формат отсортированного файла с выравниванием (.bam) в .bed( -i - указывает на имя файла, формат которого мы меняем) |
bedtools intersect -u -wa -a /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed -b chr15_sorted.bed > intersect.bed | пересечение чтений и последовательности (без глубины) |
Команда (со всеми параметрами) | Описание (что делает) |
bedtools intersect -a /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed -b chr15_sorted.bed -wa -wb > oneread.bed | Опция -wa -wb записывает в файл oneread.bed таким образом, что одна строка соответствует одному покрытию ридом |
bedtools coverage -a /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed -b chr15_sorted.bed | grep -r "chr15" > chr15_covered.bed | подсчет покрытия разметки нашими ридами + удаление лишнего, кроме нужной хромосомы |
sort -u chr15_covered.bed > chr15_covered_new.bed | удаление повторов |
grep -v "0.0000000" chr15_covered_new.bed > chr15_finish.bed | отделение ненулевых покрытий |
Ген | Полное имя | Организм | Доп. названия | Эксп. Размер | Координаты | Функция белка |
ALDH1A2 | ALDH1A2 aldehyde dehydrogenase 1 family member A2 | Homo sapiens | RALDH2; RALDH2-T; RALDH(II) | 390449 - 544443 | 58245622 ... 58790065 | Этот белок относится к семейству белков альдегиддегидрогеназы. Продукт этого гена представляет собой фермент, который катализирует синтез ретиноевой кислоты (RA) из ретинальдегида. Ретиноевая кислота, активное производное витамина А (ретинол), является гормональной сигнальной молекулой, которая функционирует в развивающихся и взрослых тканях. Исследования сходного гена мыши позволяют предположить, что этот фермент и цитохром CYP26A1 одновременно устанавливают локальные уровни эмбриональной ретиноевой кислоты, которые способствуют развитию заднего органа и предотвращают расщепление позвоночника. Для этого гена были идентифицированы четыре варианта транскрипта, кодирующих разные изоформы. |
LIPC | lipase C, hepatic type | Homo sapiens | HL; HTGL; LIPH; HDLCQ12 | 2 - 158383 | 58702768 ... 58856207 | LIPC кодирует печеночную триглицеридную липазу, которая экспрессируется в печени. LIPC выполняет двойную функцию триглицеридгидролазы и лиганд / мостикового фактора для рецептор-опосредованного поглощения липопротеинов |
HMG20A | high mobility group 20A | Homo sapiens | HMGX1; HMGXB1 | 2 - 12729 | 77712754 ... 77777949 | - |
ACAN | aggrecan | Homo sapiens | AGC1; SEDK; AGCAN; CSPG1; MSK16; CSPGCP; SSOAOD | 2 - 71911 | 89346674 ... 89394752 | Кодируемый белок является неотъемлемой частью внеклеточного матрикса в хрящевой ткани и выдерживает сжатие в хряще. Мутации в этом гене могут быть вовлечены в дисплазию скелета и дегенерацию позвоночника. В этом гене были обнаружены несколько альтернативно сплайсированных вариантов транскрипта, которые кодируют разные изоформы белка |
номер задания | задание | команда |
1 | Получите из файла c выравниванием файл с чтениями в формате fastq | bedtools bamtofastq -i input.bam -fq output.fastq |
4 | Объедините Ваши чтения в кластеры (используйте bed файл с выровненными чтениями из Обязательной части задания) | bedtools cluster -i chr15_sorted.bed -s > cluster.bed |
5 | Наберите из Вашей хромосомы 1000 случайных фрагментов по 200 нуклеотидов | /P/y14/term3/block4/SNP/bedtools2/bin/bedtools random -l 200 -n 1000 -g chr15.fasta >> random_chr15.bed |