Сборка de novo
В данном практикуме работа велась с той же хромосомой, что и в предыдущем. Сборка проводилась для файла с очищенными программой Trimmomatic чтениями.
Задание 1.
При помощи пакета velvet из очищенных чтений были собраны континги без использования референса (команды velveth chr2 31 -short -fastq outfile.fastq,
velvetg chr2).
В итоговом графе получилось 467 узлов (собрано 467 контигов), N50 = 237, максимальная длина контига = 991, общая длина = 30723.
Ссылка на получившийся набор контигов.
Задание 2.
При помощи программы blastn (алгоритм megablast) было проведено сравнение контигов с последовательностью хромосомы. Для этого сначала была создана БД blast
из последовательности хромосомы (команда makeblastdb -in chr2.fasta -dbtype nucl). Затем был проведен запуск blastn
(команда blastn -db chr2.fasta -query chr2/contigs.fa -outfmt 6 -out chr2.fasta).
Результат в виде таблицы Excel. Всего было 22316 контигов, а однозначно картировавшихся контигов 265 (1.19% всех контигов).