Однонуклеотидные полиморфизмы (SNP) - это единичные отличия в ДНК в геноме представителей одного вида или между гомологичными участками гомологичных хромосом, которые возникают в результате точечных мутаций. Индели — делеции, а также инсерции в хромосоме.
С помощью программ samtools и bcftools, используя samtools: mpileup -ugf seq.fasta bwa_seq.sorted.bam > anth.bcf; bcftools view -vcg anth.bcf > anth.vcf, был получен файл anth.vcf со списком инделей и однонуклеотидных полиморфизмом, содержащихся в очищенных чтениях предыдущего практикума. С помощью команд grep 'INDEL;' anth.vcf | wc -l и grep 'DP=' anth.vcf | wc -l было подсчитано количество инделей (289) и SNP (607) соответственно.Сборку геномов хлоропласта и митохондрии можно осуществить при помощи пакета velvet, который использует граф де Брёйна для сборки. В пакет входят две программы: velveth создаёт на основе чтений банк k-меров, на вход ей подаются риды и длина желаемого k-мера. velvetg строит граф де Брёйна и производит сборку контигов.
Качество сборки показывает значение N50, в нашем случае при k=31 было достигнуто оптимальное значение N50. Использовались команды:
velveth velveth_dir_31 31 -fastq Ath_tae_CTTGTA_L003_R1_006_out.fastq velvetg velveth_dir_31 -cov_cutoff auto
Создана директория velveth_dir, в которой находятся файлы с контигами, графами, референсной последовательностью и файл stats.txt с информацией о полученных контигах.
Далее построено выравнивание десяти самых длинных контигов (best_cont.fa) на последовательность хлоропласта и митохондрии командами makeblastdb -in seq.fasta -dbtype nucl и blastn -task blastn -query best_cont.fa -db seq.fasta -outfmt 7 -num_alignments 1 -out pr14.fa. Результат blastn: pr14.fa. Информация о десяти самых длинных контигах представлена в таблице 1.
Номер контига | Длина контига | Геном |
38672 | 5049 | митохондрия |
41982 | 4537 | митохондрия |
245294 | 4181 | митохондрия |
33065 | 3837 | митохондрия |
139635 | 2891 | митохондрия |
29675 | 2873 | митохондрия |
138080 | 2871 | митохондрия |
144238 | 2865 | митохондрия |
396032 | 2817 | митохондрия |
395302 | 2688 | митохондрия |