Были взяты риды из проекта с id: SRR4240378.
Для использования программы trimmomatic ILLUMINACLIP адаптеры из директориии /mnt/scratch/NGS/adapters были собраны в один fasta файл. Для удаления адаптеров была использована команда:
java -jar /usr/share/java/trimmomatic.jar SE -phred33 SRR4240378.fastq.gz SRR4240378_cleaned.fastq.gz ILLUMINACLIP:adapters.fasta:2:7:7
Для триммирования нуклеотидов с качеством прочтения ниже 20, и удаления ридов короче 32 нуклеотидов была использована команда:
java -jar /usr/share/java/trimmomatic.jar SE -phred33 SRR4240378_cleaned.fastq.gz SRR4240378_filt.fastq.gz TRAILING:20 MINLEN:32
После этих шагов из 4420587 ридов осталось 4154738, размер файла уменьшился с 91 до 84 Мб.
K-меры были получены командой:
velveth velveth_1 31 -short -fastq SRR4240378_filt.fastq.gz
Контиги были собраны командой:
velvetg velveth_1
Ниже представллены некоторые характеристики полученной сборки:
N50: 8084
3 наиболее длинных контига:
Контиги были выравнены на геном бактерии Buchnera aphidicola (AC: CP009253) с помощью NCBI megablast с использованием опции: Align two or more sequences.
Контиг 8
Выравнялся кусочно в 7 местах на хромосому, характеристики ниже представлены для самого длинного выравнивания:
Контиг 56
Выравнялся кусочно в 2 местах на хромосому, ниже представлены характеристики для самого длинного выравнивания и карта локального сходства:
Контиг 18
Выравнялся кусочно в 3 местах на хромосому, ниже представлены характеристики для самого длинного выравнивания и карта локального сходства: