Учебная страница курса биоинформатики,
год поступления 2014
Практикум 15
См. указания.
- Пакетом velvet cоберите из всех чтений своего набора (прошедших очистку) контиги без использования референса. Используйте длину k-мера, равную 31. В отчёте укажите N50 и размер самого длинного контига получившейся сборки.
- Программой blastn (алгоритм megablast) сравните получившиеся контиги с последовательностью хромосомы. Опишите те контиги, которые единственным образом картируются на хромосому: их список (в порядке возрастания меньшей координаты по хромосоме), величину разрывов/перекрытий между ними. (*) Желательно объясить происхождение хотя бы части разрывов: почему velvet их не заполнил? и перекрытий: почему контиги не объединились? Также желательно написать что-нибудь про остальные контиги (не единственным образом картированные на хромосому, если такие найдутся): что за последоватлеьности они представляют?
(* – доп.) Повторите сборку программой velvet, но используя меньшую длину k-мера (например, 19 или 25; длину меньше 15 брать не стоит, больше 31 – не получится). Улучшилась сборка или ухудшилась по сравнению с k=31?
(* – доп.) Повторите сборку программой SPAdes и проанализируйте результат.