Учебный сайт Валяевой Анны

Картирование на хлоропласт и митохондрию

Работа проводилась с геномами хлоропласта и митхондрии резуховидки, записанными в один файл, и очещенными чтениями из прошлого практикума. Нужно откартировать эти чтения на референсный геном с помощью алгоритма Барроуза-Уилера, реализованного в программе BWA.

Сначала нужно провести индексирование референсного генома: bwa index rez.fasta, затем провести само картирование: bwa mem rez.fasta trimmomatic.fastq > bwa1.sam. Работа с полученным файлом в формате sam проводится программой samtools.

Для начала нужно перевести файл из формата sam в bam: samtools view -bSh bwa1.sam > aln.bam, и провести сортировку и индексирование:
samtools sort aln.bam aln.sorted
samtools index aln.sorted.bam
Затем, чтобы выяснить, сколько чтений откартировалось на каждую органеллу, была использована подпрограмма samtools: samtools idxstats aln.sorted.bam >statistics.txt, ее результаты:

ENA|Y08501|Y08501.2	366924	73116	0
ENA|AP000423|AP000423.1	154478	668336	0
*	0	0	3108519
	  

Таким образом, оказалось, что на геном митохондрии откартировалось 73116 ридов, а на геном хлоропласта - 668336.

Чтобы оценить среднее покрытие для каждой из органелл, использовалась следующая команда: samtools depth aln.sorted.bam > aln_cover.txt. Полученный файл можно посмотреть здесь. Выяснилось, что покрытие на хлоропласт в целом выше (в среднем 430), чем на митохондрию (в среднем 20).

Дата последнего обновления: 22.12.14
©Валяева Анна