Учебный сайт Дюгая Ильи

Главная

Первый семестр

Второй семестр

Ссылки

Об авторе

Однонуклеотидные полиморфизмы, индели и сборка

Однонуклеотидные полиморфизмы (SNP) - это единичные отличия в ДНК в геноме представителей одного вида или между гомологичными участками гомологичных хромосом, которые возникают в результате точечных мутаций. Индели — делеции, а также инсерции в хромосоме.

С помощью программ samtools и bcftools, используя samtools: mpileup -ugf seq.fasta bwa_seq.sorted.bam > anth.bcf; bcftools view -vcg anth.bcf > anth.vcf, был получен файл anth.vcf со списком инделей и однонуклеотидных полиморфизмом, содержащихся в очищенных чтениях предыдущего практикума. С помощью команд grep 'INDEL;' anth.vcf | wc -l и grep 'DP=' anth.vcf | wc -l было подсчитано количество инделей (289) и SNP (607) соответственно.

Сборка хлоропласта и митохондрии

Сборку геномов хлоропласта и митохондрии можно осуществить при помощи пакета velvet, который использует граф де Брёйна для сборки. В пакет входят две программы: velveth создаёт на основе чтений банк k-меров, на вход ей подаются риды и длина желаемого k-мера. velvetg строит граф де Брёйна и производит сборку контигов.

Качество сборки показывает значение N50, в нашем случае при k=31 было достигнуто оптимальное значение N50. Использовались команды:

velveth velveth_dir_31 31 -fastq Ath_tae_CTTGTA_L003_R1_006_out.fastq
velvetg velveth_dir_31 -cov_cutoff auto

Создана директория velveth_dir, в которой находятся файлы с контигами, графами, референсной последовательностью и файл stats.txt с информацией о полученных контигах.

Далее построено выравнивание десяти самых длинных контигов (best_cont.fa) на последовательность хлоропласта и митохондрии командами makeblastdb -in seq.fasta -dbtype nucl и blastn -task blastn -query best_cont.fa -db seq.fasta -outfmt 7 -num_alignments 1 -out pr14.fa. Результат blastn: pr14.fa. Информация о десяти самых длинных контигах представлена в таблице 1.


Таблица 1. Информация о десяти самых длинных контигах
Номер контига Длина контига Геном
38672 5049 митохондрия
41982 4537 митохондрия
245294 4181 митохондрия
33065 3837 митохондрия
139635 2891 митохондрия
29675 2873 митохондрия
138080 2871 митохондрия
144238 2865 митохондрия
396032 2817 митохондрия
395302 2688 митохондрия
Дата последнего обновления: 16.02.2015
Copyright © Дюгай Илья, 2014.