Главная страница
term3 🕒

Сборка de novo

TASK1. Подготовка чтений программой trimmomatic
команда
описание
gunzip SRR*.gz
cp /P/y16/term3/block3/adapters/*.fa /nfs/srv/databases/ngs/kirill
cat *.fa > adapters.fasta 
1-я команда разархивировала файл SRR*.gz
2-3 команды подготвоили нам файл с адаптерами 
java -jar /nfs/srv/databases/ngs/suvorova/trimmomatic/trimmomatic-0.30.jar SE 
-phred33 SRR*.fastq SRRtrim.fastq ILLUMINACLIP:adapters.fasta:2:7:7
Адаптеры были удалены
java -jar /nfs/srv/databases/ngs/suvorova/trimmomatic/trimmomatic-0.30.jar SE 
-phred33 SRRtrim.fastq SRRtrim2.fastq TRAILING:20 MINLEN:30
удаление фрагментов,длина которых была меньше 50 нукл-в.
Выходной файл:SRRtrim2.fastq

Input Reads: 8212761 Surviving: 7935083 (96,62%) Dropped: 277678 (3,38%)
TASK2-3.
команда
описание
velveth kmers 29 -short -fastq SRRtrim2.fastq
Velveth helps you construct the dataset(команда подготовила k-меры длины k=29 ) for 
the following program, velvetg, andindicate to the 
system what each sequence file represents.
velvetg kmers
cd kmers
сборка на основе k-меров
Некоторые Выходные файлы:stats.txt
			 contigs.fa
			 LastGrapf
 Описание контигов с наибольшими длинами
ID	длина	покрытие
1	94984	43.683441
5       70333   49.352364
9       70328   42.008892
Final graph has 1496 nodes and n50 of 67095, max 94956, total 707504
TASK4. Анализ
Contig ID
Max Score
Total Score
Query Cover(%)
E-value
Ident(%)
Gaps(average)
1
4047
32384
60
0.0
77
2.21
5
8517
34281
8
0
83
2.46
9
4748
30562
79
0
75
2.42

1.Contig 1

2.Contig 5 (Данный контиг отличается низким покрытием,оно составляет всего лишь 8%. На картинке показан большой разрыв протяженностью примерно от 50К до 600К)

3.Contig 9

© Цыганов Кирилл, 2017