Для поиска однонуклеотидных полиморфизмов и инделей в ридах,
откартированных на геном хлоропласта и митохондрии Arabidopsis thaliana в предыдущем практикуме,
воспользуемся программами samtools и bcftools.
Сначала создадим файл в формате .bcf командой:
samtools mpileup -u -g -f hloropl+mitohondr.fasta map.sort.bam > 13_1.bcf
Далее используем команду:
bcftools view -vcg 13_1.bcf > 13_1.vcf
получим файл со списком обнаруженных SNP и инделей. Подсчитаем, сколько нашлось инделей и SNP:
grep 'INDEL;' 13_1.vcf | wc -l (получилось 268)
grep 'DP=' 13_1.vcf | wc -l (получилось 666)
Длина Номер 5313 13420 4295 140995 4187 17591 3771 39941 3374 15230 3303 136926 3192 6708 3115 45699 3112 130009 3112 58281
© Амосова Алена. 2013 год | Дата последнего изменения: 21 декабря 2013. |