В этом практикуме будем работать с картированными на геном ридами из прошлого практикума. Нужно получить спискок однонуклеотидных полиморфизмов (SNP) и инделей (то есть делеций и инсерций). Для выполнения работы с bcftools необходимы перевести файл в формат .bcf. Были использованы следующие команды:
В итоге нашлось 21 инделей и 94 полиморфизма. Выходной файл формата vcf можно посмотреть по ссылке.
Сборка осуществлялась с помощью пакета velvet, использующего алгоритмы с графом Де Брёйне. С помощью двух команд был собран геном.
В таблице показаны десять самых длинных контигов.
Таблица 1. 10 самыx длинных контигов (из файла). Принадлежность определнена с помощью blast.
ID контига | длина | принадлежность |
---|---|---|
34 | 445 | хлоропласт |
18 | 407 | хлоропласт |
65 | 368 | хлоропласт |
80 | 351 | хлоропласт |
309 | 337 | хлоропласт |
51 | 335 | хлоропласт |
256 | 317 | хлоропласт |
76 | 304 | хлоропласт |
158 | 289 | хлоропласт |
Последнее обновление: 16.09.2014