Картирование на референсный геном
Для выполнения задания был создан
файл, содержащий митохондриальный и хлоропластный геном
Резуховидки Таля. Суть задания была в картировании чтений из предыдущего задания на геномы с помощью алгоритма
Барроуза-Уилера, реализованного в программе BWA на сервере Kodomo.
Для получения конечного результаты были использованы следующий команды, которые получены из мануалов:
- bwa index input.fasta - проведение индексации референсной последовательности
- bwa mem input.fasta out.fastq > aln-se.sam - запуск алгоритма BWA-MEM для последовательностей, полученных с помощью ILLUMINA
- samtools view -bSh aln-se.sam > aln.bam- перевод выравнивания в формат bam, опции: -b - выдача в формате bam,-S - подача формата sam на вход,-h - включение заголовка в выдачу
- samtools sort aln.bam aln.sorted- сортировка
- samtools index aln.sorted.bam - индексирование
- samtools idxstats aln.sorted.bam >statistics.txt - статистика
- samtools depth aln.sorted.bam > aln_cover.txt-получение данных по покрытию каждого нуклеотида
ENA|AP000423|AP000423.1 154478 1667 0
ENA|Y08501|Y08501.2 366924 180 0
* 0 0 7669
В итоге на хлоропласт откартировалось 1667 ридов, а на митохондриальный геном - 180. Видимо, ученые брали зеленые части растений достаточно богатые
хлоропластами. Для покрытия были получены следующие данные : хлоропласты - 1,656958027, митохондорий - 1,028755869
.
Просвиров Кирилл. Дата последнего изменения: 4 октября 2014.