Сборка геномов de novo
Выдача trimmomatic после снятия адаптеров:
Input Reads: 7272621 Surviving: 7238089 (99,53%) Dropped: 34532 (0,47%)
После TRAILING и MINLEN:
Input Reads: 7238089 Surviving: 6834333 (94,42%) Dropped: 403756 (5,58%)
Размеры файлов соответственно: 734Mb; 730Mb; 686Mb.
N50 из выдачи velvetg = 25683.
Контиг | Длина | Покрытие |
6 | 49238 | 26.660851 |
2 | 45555 | 26.450466 |
34 | 43866 | 23.514977 |
Контиг 6:
5 участков выравнивания. Ниже приведены характеристики наиболее длинного с наименьшим e-value, а также карта локального сходства (так для всех трёх контигов). Примерные координаты участка хромосомы, соответствующего контигу: 127,825..173,180 (минус невыровненные участки с начала и с конца).
Range: 127825 to 140555 Score Expect Identities Gaps Strand 5465 bits(2959) 0.0 9751/13010(75%) 548/13010(4%) Plus/Plus
Контиг 2:
9 участков выравнивания. Примерные координаты участка хромосомы, соответствующего контигу: 440,755..485,679.
Range: 467412 to 474667 Score Expect Identities Gaps Strand 4047 bits(2191) 0.0 5691/7389(77%) 208/7389(2%) Plus/Minus
Контиг 34:
7 участков выравнивания. Примерные координаты участка хромосомы, соответствующего контигу: 253,223..291,560.
Range: 266073 to 275551 Score Expect Identities Gaps Strand 6154 bits(3332) 0.0 7611/9660(79%) 361/9660(3%) Plus/Plus
Контиг 2, в отличие от двух других, лёг на обратную цепь. У него дела, по-моему, хуже всех - виден огромный разрыв примерно от 24К до 33К, хотя показатели его наилучшего выравнивания превосходят таковые у двух других контигов. Что я обо всём этом думаю: для отдельных участков выравнивания характеристики хорошие, но в целом, как видно по картам, некоторые разрывы между выровненными участками соизмеримы с последними, а это, кажется, не очень-то хорошо...