Сборка de novo
МетодыДля сборки были использованы прочтения генома бактерии Buchnera aphidicola (AC: SRR4240379) из базы ENA.
Подготовка чтений программой trimmomaticУдаление адаптеров. По завершению работы trimmomatic для обрезания адаптеров была получена следующая информация:Input Reads: 7400155 Surviving: 7269852 (98.24%) Dropped: 130303 (1.76%)Вес файла изменился с 174943971 б до 172296846 бЧистка чтений. С концов чтений были удалены нуклеотиды с качеством ниже 20 и остались только чтения длиной не меньше 32 нуклеотидов. trimmomatic рассказала, что:Input Reads: 7269852 Surviving: 6974267 (95.93%) Dropped: 295585 (4.07%)Вес файла изменился с 172296846 б до 162990479 б
Сборка контиговСборка контигов на основании триммированных чтений была произведена программой Velvet:Команда velveth была использована для создания 31-меров на основании чтений.Далее была запущена команда velvetg для сборки de novo на основе k-меров:Итогом выполнения команд является информация о N50 (25646), а также файлы contigs.fa (контиги) и stats.txt (характеристики контигов).3 самых длинных контига:ID: 6 Длина: 49912 (49942 нукл) покрытие: 35.907238ID: 9 Длина: 49262 (49292 нукл) покрытие: 34.772179ID: 5 Длина: 33085 (33115 нукл) покрытие: 36.259029Контиги с аномальным покрытием:>ID: 105 Длина: 1 (31 нукл) покрытие: 2694>ID: 133 Длина: 1 (31 нукл) покрытие: 474299Оба этих контига имеют длину в 31 нуклеотид и, возможно, являются участками низкой сложности или повторами, часто встречающимися в геноме, или же это шум. Они отсутсвуют в contigs.fa.АнализЗапускаем megablast, введя две последовательности: контиг и геном штамма BAg бактерии Buchnera aphidicola (Aphis glycines) (AC: CP009253). Проанализируем каждое выравнивание.Контиг 6 выравнивается на референсный геном бактерии 5 раздельными фрагментами:
Контиг 9 выравнивается на референсный геном бактерии 10 раздельными фрагментами:
Контиг 5 выравнивается на референсный геном бактерии 4 раздельными фрагментами:
|