Однонуклеотидные полиморфизмы, индели и сборка |
||||||||||||||||||||||||||||||||||
В этом практикуме анализировались результаты картирования из прошлого практикума. С помощью следующих команд был получен файл в формате *.vcf samtools mpileup -u -g -f organels_genome.fasta sort.bam.bam > organels_genomes.bcf
Для подсчёта количества инделейи полиморфизмов использвались следующие команды: grep 'INDEL;' organels_genomes.vcf | wc -l
По результатам работы этой команды было установлено, что инделей 288, а полиморфизмов 672. Для сборки контигов использовалась программа velvet. Для начала сборки нужно ввести представленные ниже команды. Для работы программы была выбрана длина k-мера 23, так как её соответствет максимальное значение N50 - 241. velveth velveth_dir_23 23 -fastq Ath_tae_CTTGTA_L003_R2_005.cleaned.fastq
В таблице 1 приведены данные о десяти самых длинных контигах. Их принадлежность определялась локальных бластом с помощзью команд, приведённых ниже. makeblastdb -in organels_genome.fasta -dbtype nucl
|
© Демкив Андрей 2013 | Дата последнего изменения: 29.05.2015 |