Третий семестр

Интересно и полезно

Главная

Семестры

Ссылки

О себе

Практикум№1(3 блок)

SNP, индели и сборка

С помощью программ samtools и bcftools получите список однонуклеотидных полиморфизмов (SNP) и инделей (то есть делеций и инсерций) Мы посчитали отдельно для митохондрий - полиморфизмов - 69, инделей - 10; для хлоропластов - полиморфизов - 66, инделей - 13. Файлы со списком (митохондрия, хлоропласт).

Для того, что определить количество делеций и инсерций, мы использовали определенные команды -

 samtools mpileup -ugf *.fasta *.sorted.bam > *.bcf  (Создание файла в формате .bcf)
      bcftools view -vcg 14_1.bcf > 14_1.vcf (Подсчет количества полиморфизмов и инделей)
      grep 'INDEL;' 14_1.vcf | wc -l // grep 'DP=' 14_1.vcf | wc -l

Далее ну)\(но было собирать геномы хлоропласта и митохондрии из всех чтений своего набора (прошедших очистку) пакетом velvet. Для этого мы использовали команды

 velveth velveth_dir 31  -fastq  output.fastq
 velvetg velveth_dir -cov_cutoff auto	
N50 составило 113 нуклеотидов, то есть 50% длины гипотетической последовательности покрываются контигами длины 113 и более. ( Для того, чтобы найти мы подобрали один параметр (k-меров) = 31

Далее мы составим таблицу для десять самых длинных контигов, для этого мы пользовали локальный blast.
IDlght
140 469
433 381
169 353
196 353
350 324
217 312
256 312
128 300
489 296