SRR4240360 - чтения
команда | размер получившегося файла | выдача |
---|---|---|
wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR424/000/SRR4240360/SRR4240360.fastq.gz; gunzip SRR4240360.fastq.gz | 872,768,784 | изначальный файл |
java -jar /nfs/srv/databases/ngs/suvorova/trimmomatic/trimmomatic-0.30.jar SE -phred33 13_gen_reads.fastq 13_trim_1.fastq ILLUMINACLIP:illumina_adapters.fasta:2:7:7 | 868,013,364 | Input Reads: 8254632 Surviving: 8212774 (99,49%) Dropped: 41858 (0,51%) |
java -jar /nfs/srv/databases/ngs/suvorova/trimmomatic/trimmomatic-0.30.jar SE -phred33 13_trim_1.fastq 13_trim_2.fastq TRAILING:20 | 849,067,124 | Input Reads: 8212774 Surviving: 8140976 (99,13%) Dropped: 71798 (0,87%) |
java -jar /nfs/srv/databases/ngs/suvorova/trimmomatic/trimmomatic-0.30.jar SE -phred33 13_trim_2.fastq 13_trim_3.fastq MINLEN:32 | 834,783,814 | Input Reads: 8140976 Surviving: 7915474 (97,23%) Dropped: 225502 (2,77%) |
Запуск velveth:
velveth 13_velveth 31 -short -fastq 13_trim_3.fastq
N50 = 43070
номер | длина | покрытие |
---|---|---|
1 | 113474 | 33.525459 |
5 | 83603 | 33.646065 |
4 | 64155 | 35.847324 |
Anchor: Query_20127 (449,411..555,905) (координаты контига на последовательности родственной бактерии)
Query: Query_20125 (1,574..110,741)
Итого с некоторыми инделями контиг в правильносм направлении лег на геном:
Anchor: Query_60509 (98,408..173,180)
Query: Query_60507 (3,755..79,107)
Можно было бы подумать, что мы видим крупную транслокацию, но потом я вспомнила, что
хромосома кольцевая, поэтому контиг снова просто хорошо без инверсий и с некоторыми инделями лег на геном :)
Anchor: Query_42083 (2,004..32,745)
Query: Query_42081 (31,205..62,517)
Anchor: Query_42083 (599,832..627,104)
Query: Query_42081 (393..28,039)