О себе | I семестр | II семестр | Сайт ФББ



Сборка генома de novo

КомандаЧто делаетВходной файлВыходной файл
cat *.fa >> ../adapters.fa Собирает последовательность адаптеров в один fasta файл Файлы из папки с адаптерами adapters.fa
java -jar /nfs/srv/databases/ngs/suvorova/trimmomatic/trimmomatic-0.30.jar SE -phred33 SRR4240358.fastq pr14_1_without_adapters.fastq ILLUMINACLIP:adapters.fasta:2:7:7 Убирает адаптеры из записи SRR4240358.fastq
adapters.fasta
pr14_1_without_adapters.fastq
fastqc pr14_1_without_adapters.fastq Контроль качества чтений pr14_1_without_adapters.fastq pr14_1_without_adapters_fastqc.zip
pr14_1_without_adapters_fastqc.html
java -jar /nfs/srv/databases/ngs/suvorova/trimmomatic/trimmomatic-0.30.jar SE -phred33 pr14_1_without_adapters.fastq pr14_1_trimm.fastq TRAILING:20 MINLEN:30 Удаление чтений плохого качества (Q<20) и слишком маленькой длины (<30) pr14_1_without_adapters.fastq pr14_1_trimm.fastq
fastqc pr14_1_trimm.fastq Контроль качества очищенных чтений pr14_1_trimm.fastq pr14_1_trimm_fastq.zip
pr14_1_trimm_fastq.html
velveth kmers 29 -fastq -short pr14_1_trimm.fastq Создаёт библиотеку k-меров pr14_1_trimm.fastq Директория kmers с файлами Roadmaps, Sequences, Log
velvetg kmers Получение контигов Директория kmers contigs.fa
Graph
LastGraph
stats.txt
PreGraph



После чисткиридов программой trimmomatic из 10368832 ридов осталось 8580890 (82,76%).

Размер файлов с ридами:
SRR4240358.fastq (изначальный файл) - 1125 M
pr14_1_without_adapters.fastq (очищенный от остатков адаптеров файл) - 1106 M
pr14_1_trimm.fastq (очищенный от плохих ридов программой trimmomatic) - 876 M
Final graph has 686 nodes and n50 of 13818. 3 самых длинных контига:
ID контигадлинапокрытие (short1_cov)
93849636.683526
63074738.855953
72798440.812321


Разброс значений покрытий контигов большой: есть по несколько десятков контигов с покрытием <2.000000 и >500.000000, поэтому выделять несколько аномальных значений нет смысла.

Анализ самых длинных контигов с помощью megablast

1. Contig 9
Было построено 9 выравниваний с Identities от 76% до 81%. Контиг лёг на прямую цепь.


2. Contig 6
Было построено 3 выранивания, контиг лёг на обратную цепь.


3. Contig 7
Было построено 6 выравниваний, контиг лёг на обратную цепь.







© Антоненкова Юлия, 2017