Команда |
Что делает |
gunzip -d SRR4240387.fastq.gz | Распаковка скачанного архива |
fastqc SRR4240387.fastq | Анализ файла с ридами с помощью программы FastQC |
cat *.fa >> adapters.fasta | Скопированные файлы с адаптерами для Illumina были объединены в один файл |
java -jar /nfs/srv/databases/ngs/suvorova/trimmomatic/trimmomatic-0.30.jar SE -phred33 SRR4240387.fastq reads_fixed.fastq ILLUMINACLIP:adapters.fasta:2:7:7 TRAILING:20 MINLEN:30 | Удаляет адаптеры из файлы с ридами, а затем удаляет нуклеотиды с качеством чтения <20 и риды короче 30 нуклеотидов |
fastqc reads_fixed.fastq | Анализ файла с ридами с помощью FastQC после работы программы trimmomatic |
Из рисунка 1 видно, что риды плохого качества, поэтому было решено воспользоваться программой trimmomatic.
Команда |
Что делает |
velveth 29mers 29 -fastq -short reads_fixed.fastq | Создание библиотеки контигов в папке 29mers |
velvetg 29mers/ | Получение контигов |
Характеристика |
Значение |
Длина графа | 1156 |
N50 | 1367 |
Длина | 633.756 |
Саммые длинные контиги | ID: 78 | Длина: 7399 | Покрытие: ~33.422 |
ID: 26 | Длина: 6230 | Покрытие: ~25.779 | |
ID: 21 | Длина: 5261 | Покрытие: ~23.969 | |
Аномальные контиги | ID: 125 | Длина: 280 | Покрытие: ~406.414 |
ID: 4 | Длина: 1156 | Покрытие: ~253.037 | |
ID: 875 | Длина: 69 | Покрытие: ~2.029 |
ID |
Координаты |
Мисматчи |
Гэпы |
Покрытие, % |
78 | 35162..42578 | 1219 | 66 | 99 |
26 | 536550..542787 | 1248 | 111 | 99 |
21 | 584329..587054 | 677 | 108 | 51 |
По картам локальных сходств видно, что контиги 78 и 26 инвертированы относительно последовательности генома Buchnera aphidicola, а контиг 21 соответствует прямой цепи хромосомы. Для каждого контига было построено по 1 выравниванию без существенных разрывов.
Учебные реалии, или список семестров;
© Daniel Igumnov, 2018