Семестры Домой Проекты Обо мне

Картирование на референсный геном

Упр.1.Картирование на хлоропласт и митохондрию

1) Создан единый fasta файл, включающий в себя геномы хлоропласта и митохондрии резуховидки.

2) На геномы были откартированы очищенные чтения из предыдущего задания программои BWA. Для начала работы с последовательностью нужно ее проиндексировать с помощью команды:

bwa index Mit+Chl.fasta

Далее, я использовал одну из двух специальных команд, которые используются для работы с геномами:
bwa mem Mit+Chl.fasta Ath_tae_008_1.fastq > aln_mc_out.sam

Почему была выбрана именно такая команда? Потому что, BWA-MEM и BWA-SW хоть и имеют схожие функции, но BWA-MEM, является новым алгоритмом, который, как правило, используется для работы с высококачественными последовательностями, также он работает несколько быстрее и качественнее. BWA-MEM также имеет лучшую производительность, для 70-100bp Illumina.

3) После работы алгоритма, был получен файл с выравниваниями. Теперь же нужно выяснить, сколько чтений откартировалось на каждую органеллу. Сделаем это с помощью программы Samtools.

3.1) Переводим файл в формат *.bam командой:

samtools view -bSh aln_mc_out.sam > aln_mc_out_1.bam

3.2) Сортируем полученный файл командой:

samtools sort aln_mc_out_1.bam aln_mc_out_1.sorted

3.3) Осуществим индексирование полученного файла командой:

samtools index aln_mc_out_1.sorted.bam

3.4) Теперь нужно выяснить количество откартированных ридов на митохондрию и хлоропласт, сделаем это с помощью команды:

samtools idxstats aln_mc_out_1.sorted.bam

3.5) Получены данные по количеству ридов, на хлоропласт откартировалось 650143 рида, а на митохондрию откартировалось 71153 ридов:
ENA|AP000423|AP000423.1 154478 650143 0
ENA|Y08501|Y08501.2 366924 71153 0
*_______0_______0 3031181

4) Для того, чтобы выяснить длину покрытий органелл использовалась команда:

samtools depth aln_mc_out_1.sorted.bam > aln_mc_out_1_cover.txt

4.1)Расчет средней длины покрытия проводился в Excel. Средняя длина покрытий для Хлоропласта - 146,5 bp, а для Митохондрии - 12 bp.

Контакты
Ленинские горы МГУ 1, стр. 73
8-916-939-49-78
jiabicht@rambler.ru
vk.com/allweiss
FBBФакультет Биоинженерии и Биоинформатики