После первого запуска trimmomatic отбросил 97710 (1.87%) чтений - они оказались остатками адаптеров. После второго запуска было удалено 75915 (1.48%) чтений; размер файла уменьшился с 110.8 мб (trim1.fq.gz) до 106.8 мб (trim2.fq.gz).
N50 сборки - 12382, среднее покрытие - 25.77. Список контигов, их длин и покрытий, а также вычисление среднего покрытия доступны в таблице contigs-info.xlsx
Контиг с аномально высоким покрытием: Node_55 (длина: 934, покрытие: 130.49);
Некоторые контиги с аномально низким покрытием: Node_228 (длина: 62, покрытие: 2.42); Node_106 (длина: 80, покрытие: 2.70).
Анализ сборки.
Контиги Node_3. Node_20 и Node_22 были выровнены на готовый геном с помощью megablast. Для каждого из них лишь одно выравнивание прошло порог E-value 0.05. Каждое имеет характеристики, позволяющие с высокой долей уверенности утверждать, что контиги найдены на хромосоме правильно (см. Табл.1).
Таблица 1.Характеристика выравниваний контигов и бактериальной хромосомы.
Контиг
Координаты на хромосоме
E-value
Несовпадения нуклеотидов
Гэпы
Node_3
613658-11103
0.00
1748
244
Node_20
252164-229411
0.00
2315
387
Node_22
573092-594099
0.00
2147
463
Рис. 1. Карты локального сходста хромосомы бактерии и контигов Node_3 (A), Node_20 (B) и Node_22 (C). Виден крупный участок несоответствия у Node_20 и два - у Node_22.