Учебный сайт Валяевой Анны
SNP, индели и сборка
Поиск однонуклеотидных полиморфизмов и инделей
Работа проводилась с ридами, картированными на геномы хлоропласта и митхондрии резуховидки из прошлого практикума. Для работы с программой bcftools нужно перевести файл в формат .bcf: samtools mpileup -ugf rez.fasta aln.sorted.bam > indels.bcf. Затем были найдены индели и однонуклеотидные полиморфизмы: bcftools view -vcg indels.bcf > indels.vcf. С помощью команд grep и wc -l подсчитали количество инделей - 287, SNP - 653.
Сборка хлоропласта и митохондрии
Для сборки генома использоваласть программа velvet.
Для начала нужно создать банк k-меров длиной 23: velveth velveth_dir 35 -fastq trimmomatic.fastq. N50 в этом случае равен 248.
Затем была произведена сборка по банку k-меров: velvetg velveth_dir -cov_cutoff auto.
С помощью сортировки в MS Excel были выбраны 10 самых длинных контигов, информация о них представлена в таблице 1. Принадлежность контигов была проверена с помощью BLAST online
Номер контига | Длина контига | Принадлежность |
5781 | 6009 | Митохондрия |
49177 | 4538 | Митохондрия |
7700 | 4174 | Митохондрия |
5801 | 3841 | Митохондрия |
391 | 3793 | Митохондрия |
12967 | 3429 | Митохондрия |
5171 | 3305 | Митохондрия |
37868 | 3210 | Митохондрия |
13227 | 3201 | Митохондрия |
2928 | 3177 | Митохондрия |
Дата последнего обновления: 28.12.14
©Валяева Анна