8-916-939-49-78
jiabicht@rambler.ru
vk.com/allweiss
1) Создан единый fasta файл, включающий в себя геномы хлоропласта и митохондрии резуховидки.
2) На геномы были откартированы очищенные чтения из предыдущего задания программои BWA. Для начала работы с последовательностью нужно ее проиндексировать с помощью команды:
bwa index Mit+Chl.fasta
bwa mem Mit+Chl.fasta Ath_tae_008_1.fastq > aln_mc_out.sam
Почему была выбрана именно такая команда? Потому что, BWA-MEM и BWA-SW хоть и имеют схожие функции, но BWA-MEM, является новым алгоритмом, который, как правило, используется для работы с высококачественными последовательностями, также он работает несколько быстрее и качественнее. BWA-MEM также имеет лучшую производительность, для 70-100bp Illumina.
3) После работы алгоритма, был получен файл с выравниваниями. Теперь же нужно выяснить, сколько чтений откартировалось на каждую органеллу. Сделаем это с помощью программы Samtools.
3.1) Переводим файл в формат *.bam командой:
samtools view -bSh aln_mc_out.sam > aln_mc_out_1.bam
3.2) Сортируем полученный файл командой:
samtools sort aln_mc_out_1.bam aln_mc_out_1.sorted
3.3) Осуществим индексирование полученного файла командой:
samtools index aln_mc_out_1.sorted.bam
3.4) Теперь нужно выяснить количество откартированных ридов на митохондрию и хлоропласт, сделаем это с помощью команды:
samtools idxstats aln_mc_out_1.sorted.bam
3.5) Получены данные по количеству ридов, на хлоропласт откартировалось 650143 рида, а на митохондрию откартировалось 71153 ридов:
ENA|AP000423|AP000423.1 | 154478 | 650143 | 0 |
ENA|Y08501|Y08501.2 | 366924 | 71153 | 0 |
*_______0_______0 | 3031181 |
4) Для того, чтобы выяснить длину покрытий органелл использовалась команда:
samtools depth aln_mc_out_1.sorted.bam > aln_mc_out_1_cover.txt
4.1)Расчет средней длины покрытия проводился в Excel. Средняя длина покрытий для Хлоропласта - 146,5 bp, а для Митохондрии - 12 bp.