Учебный сайт Ксении Худяковой

Главная
Семестры
Обо мне
Ссылки

Чтения из предыдущего практикума будут картированы на геномы хлоропласта и митохондрии резуховидки. Для этого будет использована программа BWA. Последовательности геномов хлоропласта и митохондрии были скачаны и объединены в один файл. Для начала геномы нужно было проиндексировать с помощью команды:

bwa index genomes.fasta
Картирование произведено с помощью команды:
bwa mem genomes.fasta f1.fastq > out.sam

Пакет программ samtools работает с полученными выравниваниями. Первой строкой файл был переведен в формат .bam (опция -b - формат выходного файла, опция -S - формат исходного файла, опция -h - включение заголовка), потом полученный файл был отсортирован и проиндексирован.

                        samtools view -b -S -h out.sam > out.bam
                        samtools sort out.bam out_sorted
                        samtools index out_sorted.bam
                        samtools idxstats out_sorted.bam
                        

В таблице ниже, которая получилась после выполнения последней команды, отражены название последовательности, на которую производилось картирование (AP000423.1 - хлоропласт, Y08501.2 - митохондрия), длина последовательности и количество чтений, откартированных на неё.

Далее необходимо было рассчитать среднее покрытие для органелл. Команда

samtools depth out_sorted.bam > cover.txt
выдает таблицу с рядами чисел, каждое из которых соответствует покрытию для нуклеотида. Взяв среднее значение, я получила, что для хлоропласта среднее значение = 270, а для митохондрии = 12.