команда |
описание |
gunzip SRR*.gz cp /P/y16/term3/block3/adapters/*.fa /nfs/srv/databases/ngs/kirill cat *.fa > adapters.fasta |
1-я команда разархивировала файл SRR*.gz 2-3 команды подготвоили нам файл с адаптерами |
java -jar /nfs/srv/databases/ngs/suvorova/trimmomatic/trimmomatic-0.30.jar SE -phred33 SRR*.fastq SRRtrim.fastq ILLUMINACLIP:adapters.fasta:2:7:7 |
Адаптеры были удалены |
java -jar /nfs/srv/databases/ngs/suvorova/trimmomatic/trimmomatic-0.30.jar SE -phred33 SRRtrim.fastq SRRtrim2.fastq TRAILING:20 MINLEN:30 |
удаление фрагментов,длина которых была меньше 50 нукл-в. Выходной файл:SRRtrim2.fastq |
Input Reads: 8212761 Surviving: 7935083 (96,62%) Dropped: 277678 (3,38%)TASK2-3.
команда |
описание |
velveth kmers 29 -short -fastq SRRtrim2.fastq |
Velveth helps you construct the dataset(команда подготовила k-меры длины k=29 ) for the following program, velvetg, andindicate to the system what each sequence file represents. |
velvetg kmers cd kmers |
сборка на основе k-меров Некоторые Выходные файлы:stats.txt contigs.fa LastGrapf |
Описание контигов с наибольшими длинами ID длина покрытие 1 94984 43.683441 5 70333 49.352364 9 70328 42.008892 Final graph has 1496 nodes and n50 of 67095, max 94956, total 707504TASK4. Анализ
Contig ID |
Max Score |
Total Score |
Query Cover(%) |
E-value |
Ident(%) |
Gaps(average) |
1 |
4047 |
32384 |
60 |
0.0 |
77 |
2.21 |
5 |
8517 |
34281 |
8 |
0 |
83 |
2.46 |
9 |
4748 |
30562 |
79 |
0 |
75 |
2.42 |
|
|
|
© Цыганов Кирилл, 2017