Однонуклеотидные полиморфизмы, индели и сборка
Поиск однонуклеотидных полиморфизмов и инделей
Для выполнению задания были использованы риды, картированные на геномы из предыдущего практикума.
Для выполнение работы с bcftools необходимы перевести файл в формат .bcf.
Были использованы следующие команды:
- samtools mpileup -ugf input.fasta aln.sorted.bam > pr14.bcf- создание файла в формате bcf, опции:
-g - рассчет сходства генотипов и выдать файл в формате bcf,
-u - выдача несжатого bcf,
-f - приложение файла с референсной последовательностью
- bcftools view -vcg pr14.bcf > pr14.vcf - расчет SNP и инделей
- grep 'INDEL;' pr14.vcf | wc -l
- grep 'DP=' pr14.vcf | wc -l
В итоге нашлось 19 инделей и 72 полиморфизма. Файл формата vcf можно получить по
ссылке.
Сборка хлоропласта и митохондрии
Сборка осуществлялась с помощью пакета velvet, использующего алгоритмы с графом Де Брейне. С помощью двух команд был собран геном.
- velveth velveth_dir 32 -fastq out.fastq - создание банка k-меров длиной 32
- velvetg velveth_dir -cov_cutoff auto - соединение k-меров с помощью графа в контиги
NP50 - 109.
ID | lgth | out | in | long_cov | short1_cov | short1_Ocov | short2_cov | short2_Ocov | long_nb | short1_nb | short2_nb |
34 | 445 | 0 | 0 | 0.000000 | 1.833708 | 1.833708 | 0.000000 | 0.000000 | 0 | 0 | 0 |
18 | 407 | 0 | 0 | 0.000000 | 2.746929 | 2.746929 | 0.000000 | 0.000000 | 0 | 0 | 0 |
65 | 368 | 0 | 0 | 0.000000 | 1.861413 | 1.861413 | 0.000000 | 0.000000 | 0 | 0 | 0 |
80 | 351 | 0 | 0 | 0.000000 | 2.037037 | 2.037037 | 0.000000 | 0.000000 | 0 | 0 | 0 |
309 | 337 | 0 | 0 | 0.000000 | 2.341246 | 2.249258 | 0.000000 | 0.000000 | 0 | 0 | 0 |
51 | 335 | 0 | 0 | 0.000000 | 1.459701 | 1.364179 | 0.000000 | 0.000000 | 0 | 0 | 0 |
256 | 317 | 0 | 0 | 0.000000 | 2.028391 | 1.930599 | 0.000000 | 0.000000 | 0 | 0 | 0 |
76 | 304 | 0 | 0 | 0.000000 | 1.588816 | 1.588816 | 0.000000 | 0.000000 | 0 | 0 | 0 |
158 | 289 | 0 | 0 | 0.000000 | 1.788927 | 1.788927 | 0.000000 | 0.000000 | 0 | 0 | 0 |
558 | 273 | 0 | 0 | 0.000000 | 1.732601 | 1.732601 | 0.000000 | 0.000000 | 0 | 0 | 0 |
Таблица 1. Десять самых длинных контигов, информация получена из статистики с помощью сортировки в Excel
Просвиров Кирилл. Дата последнего изменения: 4 октября 2014.