Практикум 14

SRR4240360 - чтения

Таблица 1. Trimmomatic
команда размер получившегося файла выдача
wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR424/000/SRR4240360/SRR4240360.fastq.gz; gunzip SRR4240360.fastq.gz 872,768,784 изначальный файл
java -jar /nfs/srv/databases/ngs/suvorova/trimmomatic/trimmomatic-0.30.jar SE -phred33 13_gen_reads.fastq 13_trim_1.fastq ILLUMINACLIP:illumina_adapters.fasta:2:7:7 868,013,364
 Input Reads: 8254632 Surviving: 8212774 (99,49%) Dropped: 41858 (0,51%) 
java -jar /nfs/srv/databases/ngs/suvorova/trimmomatic/trimmomatic-0.30.jar SE -phred33 13_trim_1.fastq 13_trim_2.fastq TRAILING:20 849,067,124
 Input Reads: 8212774 Surviving: 8140976 (99,13%) Dropped: 71798 (0,87%) 
java -jar /nfs/srv/databases/ngs/suvorova/trimmomatic/trimmomatic-0.30.jar SE -phred33 13_trim_2.fastq 13_trim_3.fastq MINLEN:32 834,783,814
 Input Reads: 8140976 Surviving: 7915474 (97,23%) Dropped: 225502 (2,77%) 

Запуск velveth:
velveth 13_velveth 31 -short -fastq 13_trim_3.fastq

Cборка

N50 = 43070

Таблица 2. Контиги
номер длина покрытие
1 113474 33.525459
5 83603 33.646065
4 64155 35.847324
Аномальные: Есть последовательность с покрытием 99.59, но ее длина всего 40 нуклеотидов, и 92.71 длиной 31 нуклеотид. Самое маленькое покрытие - 1.61 тоже у короткой последовательности длины 31 (то есть на самом деле длины к-мера - то есть просто гомологичной последовательности не нашлось).

Анализ контигов

1. NODE_1_length_113474_cov_33.525459

Anchor: Query_20127 (449,411..555,905) (координаты контига на последовательности родственной бактерии)
Query: Query_20125 (1,574..110,741)
Итого с некоторыми инделями контиг в правильносм направлении лег на геном: image
image

2. NODE_5_length_83603_cov_33.646065

Anchor: Query_60509 (98,408..173,180)
Query: Query_60507 (3,755..79,107)
image
image

3. NODE_4_length_64155_cov_35.847324

Можно было бы подумать, что мы видим крупную транслокацию, но потом я вспомнила, что хромосома кольцевая, поэтому контиг снова просто хорошо без инверсий и с некоторыми инделями лег на геном :) Anchor: Query_42083 (2,004..32,745)
Query: Query_42081 (31,205..62,517)
Anchor: Query_42083 (599,832..627,104)
Query: Query_42081 (393..28,039)
image
image