Сборка генома de novo

Подготовка чтений программой trimmomatic

java -jar /nfs/srv/databases/ngs/bezvita/Trimmomatic-0.38/trimmomatic-0.38.jar SE -phred33 SRR4240387.fastq TRI.fastq ILLUMINACLIP:adapteadapter.fasta:2:7:7 MINLEN:30

Ридов до чистки: 15032810 Ридов после чистки: 15021581 (99,93%) Удалено ридов: 11229 (0,07%)

Создание k-меров

velveth kmers/ 29 -short -fastq TRI.fastq

Сборка на основе k-меров

N50 = 3375

Длины трёх самых длинных контигов Покрытие
15403 69.812637
14644 60.799374
12726 66.184822

Аномально малое покрытие - 1.275862. Длина данной последовательности - 29, маловероятно, что он имеет отношение к геному

Аномально высокое покрытие - 301.111115. Длина данной последовательности - 72, маловероятно, что он не имеет отношение к геному

Анализ

Контиг Координаты участка хромосомы Характеристики выравниваний
1 599832-604795; 611229-614634 Score(bits) = 3051; 1092; 1242; 209, Gaps = 172; 3; 63; 2
2 573092-582686; 584329-587055 Score(bits) = 3253; 1279, Gaps = 461; 108
3 500370-508388; 496111-500325 Score(bits) = 3864; 1927, Gaps = 315; 154

Результаты выравнивания Blast (megablast):

I Контиг:

I Контиг:

II Контиг:

II Контиг:

III Контиг:

III Контиг: