Сборка геномов de novo

Выдача trimmomatic после снятия адаптеров:

Input Reads: 7272621 Surviving: 7238089 (99,53%) Dropped: 34532 (0,47%)

После TRAILING и MINLEN:

Input Reads: 7238089 Surviving: 6834333 (94,42%) Dropped: 403756 (5,58%)

Размеры файлов соответственно: 734Mb; 730Mb; 686Mb.
N50 из выдачи velvetg = 25683.

Табл. 1. Параметры трёх самых длинных контигов.
Контиг Длина Покрытие
6 49238 26.660851
2 45555 26.450466
34 43866 23.514977

Контиг 6:
5 участков выравнивания. Ниже приведены характеристики наиболее длинного с наименьшим e-value, а также карта локального сходства (так для всех трёх контигов). Примерные координаты участка хромосомы, соответствующего контигу: 127,825..173,180 (минус невыровненные участки с начала и с конца).

Range: 127825 to 140555
Score	        Expect	Identities	Gaps	        Strand
5465 bits(2959)	0.0	9751/13010(75%)	548/13010(4%)	Plus/Plus
Карта
Рис. 1. Карта локального сходства для контига 6.

Контиг 2:
9 участков выравнивания. Примерные координаты участка хромосомы, соответствующего контигу: 440,755..485,679.

Range: 467412 to 474667
Score    	Expect	Identities	Gaps	        Strand
4047 bits(2191)	0.0	5691/7389(77%)	208/7389(2%)	Plus/Minus
Карта
Рис. 2. Карта локального сходства для контига 2.

Контиг 34:
7 участков выравнивания. Примерные координаты участка хромосомы, соответствующего контигу: 253,223..291,560.

Range: 266073 to 275551
Score	        Expect	Identities	Gaps	        Strand
6154 bits(3332)	0.0	7611/9660(79%)	361/9660(3%)	Plus/Plus
Карта
Рис. 3. Карта локального сходства для контига 34.

Контиг 2, в отличие от двух других, лёг на обратную цепь. У него дела, по-моему, хуже всех - виден огромный разрыв примерно от 24К до 33К, хотя показатели его наилучшего выравнивания превосходят таковые у двух других контигов. Что я обо всём этом думаю: для отдельных участков выравнивания характеристики хорошие, но в целом, как видно по картам, некоторые разрывы между выровненными участками соизмеримы с последними, а это, кажется, не очень-то хорошо...