Страница четырнадцатого практикума



gunzip E.fastq.gz Распаковка архива
fastqc filename.fastq Анализ качества чтений
java -jar /nfs/srv/databases/ngs/suvorova/trimmomatic/trimmomatic-0.30.jar SE -phred33 E.fastq ppd_trimmed.fastq ILLUMINACLIP:adapters.fasta:2:7:7 Удаляет адаптеры
java -jar /nfs/srv/databases/ngs/suvorova/trimmomatic/trimmomatic-0.30.jar SE -phred33 ppd_trimmed.fastq ppd_trimmed.fastq SLIDINGWINDOW:5:28 MINLEN:32 проходит скользящим окном длины 5 по каждому прочтению и убирает части ридов после любого окна со средним качеством ниже 28. Удаляет те прочтения, которые после очистки окажутся короче 32 букв.
velveth velveth 31 -fastq -short ppd_trimmed.fastq Подготавливает k-меры длины 31
velvetg velveth > velvetg.log Собирает контиги из подготовленных k-меров

В файле adapters.fasta были собраны адаптеры. Из E.fastq были удалены остатки адаптеров.

До обработки trimmomatic?

g

После обработки trimmomatic:

g
Информация о запумске trimmomatic: Опция SLIDINGWINDOW:5:28 проходит скользящим окном длины 5 и удаляет нуклеотиды с качеством ниже 28. MINLEN:32 удаляет чтения длины ниже 32. Объём исходного файла в количестве чтений - 3869462, после обработки trimmomatic - 3429061. Аналогично в байтах: 972M и 813329K.

Информация о запуске velvet: N50 - 28, самые длинные контиги имеют длины: 554, 554, 553 и покрытия соответвенно: 5.037906, 5.785199, 8.103074.
Контиг с минимальным покрытием имеет длину 16. Контиг с максимальным покрытием, как и большиство контигов здесь, имеют длину 1. Это связано с тем, что последовательность имеет обширные полиТ участки. Порытия для них равны соответсвенно 4841252.000000 и 1.

Аннотация программой BLAST. Самый длинный контиг: организм - Arabidopsis thaliana, описание - ATPase, F1 complex, delta/epsilon subunit (AT5G47030), mRNA, число выравнивание контига с данной находкой - 1, покрытие - 100%, процент идентичности - 100%.
Контиг с максимальным покрытием: организм - Arabidopsis thaliana, описание - genome assembly, chromosome: 3, количество выравниваний контига с данной находкой - 4, покрытие - 99%, процент идентичности - 100%.