Учебный сайт Валяевой Анны

SNP, индели и сборка

Поиск однонуклеотидных полиморфизмов и инделей

Работа проводилась с ридами, картированными на геномы хлоропласта и митхондрии резуховидки из прошлого практикума. Для работы с программой bcftools нужно перевести файл в формат .bcf: samtools mpileup -ugf rez.fasta aln.sorted.bam > indels.bcf. Затем были найдены индели и однонуклеотидные полиморфизмы: bcftools view -vcg indels.bcf > indels.vcf. С помощью команд grep и wc -l подсчитали количество инделей - 287, SNP - 653.

Сборка хлоропласта и митохондрии

Для сборки генома использоваласть программа velvet.

Для начала нужно создать банк k-меров длиной 23: velveth velveth_dir 35 -fastq trimmomatic.fastq. N50 в этом случае равен 248.

Затем была произведена сборка по банку k-меров: velvetg velveth_dir -cov_cutoff auto.

С помощью сортировки в MS Excel были выбраны 10 самых длинных контигов, информация о них представлена в таблице 1. Принадлежность контигов была проверена с помощью BLAST online

Таблица 1. 10 самых длинных контигов.

Номер контигаДлина контигаПринадлежность
57816009Митохондрия
491774538Митохондрия
77004174Митохондрия
58013841Митохондрия
3913793Митохондрия
129673429Митохондрия
51713305Митохондрия
378683210Митохондрия
132273201Митохондрия
29283177Митохондрия

Дата последнего обновления: 28.12.14
©Валяева Анна