Однонуклеотидные полиморфизмы, индели и сборка

В этом практикуме анализировались результаты картирования из прошлого практикума. С помощью следующих команд был получен файл в формате *.vcf

samtools mpileup -u -g -f organels_genome.fasta sort.bam.bam > organels_genomes.bcf
bcftools view -v -c -g organels_genomes.bcf > organels_genomes.vcf

Для подсчёта количества инделейи полиморфизмов использвались следующие команды:

grep 'INDEL;' organels_genomes.vcf | wc -l
grep 'DP=' organels_genomes.vcf | wc -l

По результатам работы этой команды было установлено, что инделей 288, а полиморфизмов 672.

Для сборки контигов использовалась программа velvet. Для начала сборки нужно ввести представленные ниже команды. Для работы программы была выбрана длина k-мера 23, так как её соответствет максимальное значение N50 - 241.

velveth velveth_dir_23 23 -fastq Ath_tae_CTTGTA_L003_R2_005.cleaned.fastq
velvetg velveth_dir_23 -cov_cutoff auto

В таблице 1 приведены данные о десяти самых длинных контигах. Их принадлежность определялась локальных бластом с помощзью команд, приведённых ниже.

makeblastdb -in organels_genome.fasta -dbtype nucl
blastn -task megablast -query max_contigs.fasta -db organels_genome.fasta -out organels_megablast.out -outfmt 7 -num_alignments 1
Таблица 1. Информация о десяти самых длинных контигах
Номер контига Длина Органелла
11595 7146 митохондрия
4025 5022 митохондрия
47215 4200 митохондрия
4171 4174 митохондрия
13882 3372 митохондрия
27455 3352 митохондрия
55690 3182 митохондрия
50427 3137 митохондрия
48277 2732 митохондрия
15066 2653 митохондрия

© Демкив Андрей 2013 Дата последнего изменения: 29.05.2015