Личный сайт
Просвирова Кирилла

Картирование на референсный геном

Для выполнения задания был создан файл, содержащий митохондриальный и хлоропластный геном Резуховидки Таля. Суть задания была в картировании чтений из предыдущего задания на геномы с помощью алгоритма Барроуза-Уилера, реализованного в программе BWA на сервере Kodomo. Для получения конечного результаты были использованы следующий команды, которые получены из мануалов:
  • bwa index input.fasta - проведение индексации референсной последовательности
  • bwa mem input.fasta out.fastq > aln-se.sam - запуск алгоритма BWA-MEM для последовательностей, полученных с помощью ILLUMINA
  • samtools view -bSh aln-se.sam > aln.bam- перевод выравнивания в формат bam, опции: -b - выдача в формате bam,-S - подача формата sam на вход,-h - включение заголовка в выдачу
  • samtools sort aln.bam aln.sorted- сортировка
  • samtools index aln.sorted.bam - индексирование
  • samtools idxstats aln.sorted.bam >statistics.txt - статистика
  • samtools depth aln.sorted.bam > aln_cover.txt-получение данных по покрытию каждого нуклеотида
					ENA|AP000423|AP000423.1	154478	1667	0
					ENA|Y08501|Y08501.2	366924	180	0
					*	0	0	7669

				
В итоге на хлоропласт откартировалось 1667 ридов, а на митохондриальный геном - 180. Видимо, ученые брали зеленые части растений достаточно богатые хлоропластами. Для покрытия были получены следующие данные : хлоропласты - 1,656958027, митохондорий - 1,028755869 .

Просвиров Кирилл. Дата последнего изменения: 4 октября 2014.