Для поиска однонуклеотидных полиморфизмов и инделей в ридах,
откартированных на геном хлоропласта и митохондрии Arabidopsis thaliana в предыдущем практикуме,
воспользуемся программами samtools и bcftools.
Сначала создадим файл в формате .bcf командой:
samtools mpileup -u -g -f hloropl+mitohondr.fasta map.sort.bam > 13_1.bcf
Далее используем команду:
bcftools view -vcg 13_1.bcf > 13_1.vcf
получим файл со списком обнаруженных SNP и инделей. Подсчитаем, сколько нашлось инделей и SNP:
grep 'INDEL;' 13_1.vcf | wc -l (получилось 268)
grep 'DP=' 13_1.vcf | wc -l (получилось 666)
Длина Номер
5313 13420
4295 140995
4187 17591
3771 39941
3374 15230
3303 136926
3192 6708
3115 45699
3112 130009
3112 58281
| © Амосова Алена. 2013 год | Дата последнего изменения: 21 декабря 2013. |