Однонуклеотидные полиморфизмы, индели и сборка
Поиск однонуклеотидных полиморфизмов и инделей
В этом практикуме будем работать с картированными на геном ридами из прошлого практикума. Нужно получить спискок однонуклеотидных полиморфизмов (SNP) и инделей (то есть делеций и инсерций). Для выполнения работы с bcftools необходимы перевести файл в формат .bcf. Были использованы следующие команды:
В итоге нашлось 21 инделей и 94 полиморфизма. Выходной файл формата vcf можно посмотреть по ссылке.
Сборка хлоропласта и митохондрии
Сборка осуществлялась с помощью пакета velvet, использующего алгоритмы с графом Де Брёйне. С помощью двух команд был собран геном.
В таблице показаны десять самых длинных контигов.
Таблица 1. 10 самыx длинных контигов (из файла). Принадлежность определнена с помощью blast.
| ID контига | длина | принадлежность |
|---|---|---|
| 34 | 445 | хлоропласт |
| 18 | 407 | хлоропласт |
| 65 | 368 | хлоропласт |
| 80 | 351 | хлоропласт |
| 309 | 337 | хлоропласт |
| 51 | 335 | хлоропласт |
| 256 | 317 | хлоропласт |
| 76 | 304 | хлоропласт |
| 158 | 289 | хлоропласт |