Cборка de novo
1. Подготовка чтений программой trimmomatic
java -jar /usr/share/java/trimmomatic.jar SE -phred33 SRR4240361.fastq.gz no_adapters_SRR4240361.fastq.gz ILLUMINACLIP:adapters.fasta:2:7:7С помощью данной программы были получены чтения без остатков адаптеров.
0.47% процентов последовательностей чтений оказалось остатками адаптеров.
java -jar /usr/share/java/trimmomatic.jar SE -phred33 no_adapters_SRR4240361.fastq.gz trimmed_SRR4240361.fastq.gz TRAILING:20 MINLEN:32На этом шаге с правых концов чтений были удалены нуклеотиды с качеством ниже 20 и оставлены только такие чтения, длина которых не менее 32 нуклеотидов. 5.58% чтений было удалено. Размеры файлов до очистки: 192M, после: 178М.
2. Получение k-меров
velveth velvetр_result 31 -short -fastq trimmed_SRR4240361.fastq.gz3. Cборка на основе k-меров
velvetg velvetр_result- N50: 25683
- номера трёх самых длинных контигов: 2, 6, 34
- длины трёх самых длинных контигов: 49238, 45555, 43866
- их покрытие: 26.660851, 26.450466, 23.514977
4. Анализ
Контиги были выровнены на хромосому бактерии Buchnera aphidicola с помощью NCBI megablast
1) Контиг 2

- Контиг выравнялся на хромосому в 23 участках с пробелами между некоторыми
- Координаты участка хромосомы, соответствующего контигу: 474667-462496
- Число однонуклеотидных различий: 2698
- Число гэпов: 274
2) Контиг 6

- Контиг выравнялся на хромосому в 29 участках с пробелами между некоторыми
- Координаты участка хромосомы, соответствующего контигу: 141477-176738
- Число однонуклеотидных различий: 7860
- Число гэпов: 988
3) Контиг 34

- Контиг выравнялся на хромосому в 75 участках с пробелами между некоторыми
- Координаты участка хромосомы, соответствующего контигу: 266073-285067
- Число однонуклеотидных различий: 4015
- Число гэпов: 616