8-916-939-49-78
jiabicht@rambler.ru
vk.com/allweiss
Для того, чтобы программа bcftools смогла работать, нужно перевести файлы в формат *.bcf. С помощью программ samtools и bcftools получиv список однонуклеотидных полиморфизмов и инделей для ридов, картированных на геномы хлоропласта и митохондрии из предыдущего задания. Создание файла с расширением *.bcf выглядит так:
samtools mpileup -ugf Mit+Chl.fasta aln_mc_out_1.sorted.bam > reads.bcf
Теперь посчитаем количество инделей и полиморфизмов с помощью команды:
bcftools view -vcg reads.bcf > reads_1.vcf
Здесь лежит сам файл *.vcf
Количество инделей и полиморфизмов:
INDEL | 308 |
DP | 644 |
1) Осуществим сборку генома хлоропласта и митохондрии из всех чтений набора пакетом velvet.
1.1) Создадим банк k-меров длины 31, используя команду:
velveth velveth_out 31 -fastq Ath_tae_008_1.fastq
1.2) Соединим k-меры в контиги, используя команду:
velvetg velveth_out -cov_cutoff auto
На выходе получено сообщение:
Final graph has 666166 nodes and n50 of 137, max 5630, total 55860589, using 0/3752156 reads
2) Таблица для десяти самых длинных контигов, для сортировки использовались возможности Excel:
ID | lgth | out | in | long_cov | short1_cov | short1_Ocov | short2_cov | short2_Ocov | long_nb | short1_nb | short2_nb |
6192 | 5630 | 2 | 1 | 0.000000 | 12.168384 | 12.143872 | 0.000000 | 0.000000 | 0 | 0 | 0 |
10316 | 4849 | 1 | 2 | 0.000000 | 11.217777 | 11.164570 | 0.000000 | 0.000000 | 0 | 0 | 0 |
17992 | 4181 | 1 | 1 | 0.000000 | 11.545085 | 11.505142 | 0.000000 | 0.000000 | 0 | 0 | 0 |
10549 | 3510 | 1 | 2 | 0.000000 | 8.703704 | 8.659544 | 0.000000 | 0.000000 | 0 | 0 | 0 |
10621 | 3380 | 1 | 1 | 0.000000 | 10.784615 | 10.737278 | 0.000000 | 0.000000 | 0 | 0 | 0 |
7791 | 3360 | 1 | 1 | 0.000000 | 11.751488 | 11.687202 | 0.000000 | 0.000000 | 0 | 0 | 0 |
1421 | 3147 | 1 | 1 | 0.000000 | 11.730855 | 11.721004 | 0.000000 | 0.000000 | 0 | 0 | 0 |
13761 | 3039 | 1 | 1 | 0.000000 | 10.951958 | 10.919381 | 0.000000 | 0.000000 | 0 | 0 | 0 |
217952 | 3034 | 1 | 2 | 0.000000 | 13.008899 | 12.996704 | 0.000000 | 0.000000 | 0 | 0 | 0 |