2)Очистить прочтения от адапторов
Исходные данные: C.fastq
Команды: java -jar /usr/share/java/trimmomatic.jar SE -phred33 C.fastq C+.fastq ILLUMINACLIP:adapters.fasta:2:7:7
Результат: C+.fastq
Было прочтений 3869869 (100%), осталось 3868498 (99,96%). Потеряно 1371 (0,04%)
3)Убрать плохие буквы с концов.
Отбор по качеству
Исходные данные: C+.fastq
Команды: java -jar /usr/share/java/trimmomatic.jar SE -phred33 C+.fastq C+.good2.fastq SLIDEWINDOW:5:28
Результат: C+.good2.fastq
Было прочтений 3868498 (100%), осталось 3863205 (99,86%). Потеряно 5293 (0,14%)
Отбор по длине
Исходные данные: C+.good.fastq
Команды: java -jar /usr/share/java/trimmomatic.jar SE -phred33 C+good.fastq C+long.fastq MINLEN:32
Результат: C+long.fastq
Было прочтений 3863205 (100%), осталось 3824063 (98,99%). Потеряно 39142 (1,01%)
5)Запустить velveth для создания 31-меров
Исходные данные: C+.long2.fastq
Команды: velveth /nfs/srv/databases/ngs/nastya_lacewing/14 31 -short -fastq C+long2.fastq
Результат: Log, PreGraph, Sequences
7)Информация о запуске velvet.
"Final graph has 257875 nodes and n50 of 68, max 672, total 5410757, using 0/3525084 reads."
Таким образом N50 - 68, длина самого большого контига - 672. Самое маленькое покрытие - 1.000000, самое большое - 591.813965.
8)Аннотация программой BLAST.
Был проведён поиск по BLAST для самого большого контига, поиск дал 41 сходную последовательность. Наилучшее совпадение (покрытие 100%, E-value 0.0, Ident 100%) - это оксигеназа 2 (MIOX2) организма Arabidopsis thaliana. Ссылка на BLAST и лучшую находку приведены под скрином BLAST.
Был проведён поиск по BLAST для контига с самым высоким покрытием, поиск дал 36 сходных последовательностей. Наилучшее совпадение (покрытие 100%, E-value 1e-27, Ident 100%) - это ген (NHL3) организма Arabidopsis thaliana. Ссылка на BLAST и лучшую находку приведены под скрином BLAST.
Был проведён поиск по BLAST для контига с самым низким покрытием, поиск сходных последовательностей не дал вообще. Возможно, этот контиг содержит неточности, поскольку покрытие слишком низкое.