Сборка геномов
Подготовка файлов
java -jar /nfs/srv/databases/ngs/suvorova/trimmomatic/trimmomatic-0.30.jar SE -phred33 SRR4240357.fastq SRRtrimmed.fastq ILLUMINACLIP:adapters.fa:2:7:7 | Отрезание адаптеров |
java -jar /nfs/srv/databases/ngs/suvorova/trimmomatic/trimmomatic-0.30.jar SE -phred33 SRR4240357.trimmed.fastq SRR4240357.trimmed2.fastq TRAILING:20 MINLEN:30 | Отрезание некачественных ридов |
При первом запуске trimmomatic число ридов сократилось с 8098979 до 7937705, а размер файлов с 863M до 846M. При втором с 7937705 до 7248100, и с 846M до 748M.
![https://upload.wikimedia.org/wikipedia/commons/thumb/f/fd/Color_icon_red.svg/220px-Color_icon_red.svg.png](pr14qc.png)
![https://upload.wikimedia.org/wikipedia/commons/thumb/f/fd/Color_icon_red.svg/220px-Color_icon_red.svg.png](pr14.trimmed.png)
Сборка
velveth assembly_SRR4240357 29 -fastq -short SRR4240357.trimmed2.fastq | Сборка k-меров |
velvetg assembly_SRR4240357/ | Сборка контигов |
Характеристика сборки:
nodes | 925 |
n50 | 34094 |
max | 56526 |
total | 663956 |
Blast
Последовательности трех самых длинных контигов были использованы , как query для megablast против генома Buchnera aphidicola (AC=CP009253)
![https://upload.wikimedia.org/wikipedia/commons/thumb/f/fd/Color_icon_red.svg/220px-Color_icon_red.svg.png](19cont.png)
![https://upload.wikimedia.org/wikipedia/commons/thumb/f/fd/Color_icon_red.svg/220px-Color_icon_red.svg.png](20cont.png)
![https://upload.wikimedia.org/wikipedia/commons/thumb/f/fd/Color_icon_red.svg/220px-Color_icon_red.svg.png](2cont.png)
19 контиг | 20 контиг | 2 контиг | |
max score | 26048 | 3947 | 4741 |
total score | 34094 | 19440 | 16278 |
query cover | 6% | 5% | 4% |
evalue | 0.0 | 0.0 | 0.0 |
per. identity | 78.39% | 76.70% | 77.69% |
Среднее покрытие 35.134, при этом у 93 контига покрытие 522.045455, то есть в 15 раз выше среднего.
©Бакулин Артемий, 2018