Третий семестр |
|||||||
Интересно и полезно |
Главная |
Семестры |
Ссылки |
О себе |
|||
Практикум№1(3 блок) SNP, индели и сборка С помощью программ samtools и bcftools получите список однонуклеотидных полиморфизмов (SNP) и инделей (то есть делеций и инсерций) Мы посчитали отдельно для митохондрий - полиморфизмов - 69, инделей - 10; для хлоропластов - полиморфизов - 66, инделей - 13. Файлы со списком (митохондрия, хлоропласт). Для того, что определить количество делеций и инсерций, мы использовали определенные команды - samtools mpileup -ugf *.fasta *.sorted.bam > *.bcf (Создание файла в формате .bcf) bcftools view -vcg 14_1.bcf > 14_1.vcf (Подсчет количества полиморфизмов и инделей) grep 'INDEL;' 14_1.vcf | wc -l // grep 'DP=' 14_1.vcf | wc -l Далее ну)\(но было собирать геномы хлоропласта и митохондрии из всех чтений своего набора (прошедших очистку) пакетом velvet. Для этого мы использовали команды velveth velveth_dir 31 -fastq output.fastq velvetg velveth_dir -cov_cutoff autoN50 составило 113 нуклеотидов, то есть 50% длины гипотетической последовательности покрываются контигами длины 113 и более. ( Для того, чтобы найти мы подобрали один параметр (k-меров) = 31 Далее мы составим таблицу для десять самых длинных контигов, для этого мы пользовали локальный blast.
|