Анализ качества и очистка чтений
Главная

Анализ качества чтений

Контроль качества чтений генома резуховидки из файла Ath_tae_CTTGTA_L003_R1_010.fastq был проведен с помощью программы FastQ:

fastqc Ath_tae_CTTGTA_L003_R1_010.fastq

Результат

На графике Per sequence quality scores видим, что максимальное количество ридов имеет качество 38 (вероятность ошибки между 1/1000 и 1/10000). Далее использовался формат fastq phred33.

Очистка чтений

Программой Trimmomatic с конца каждого рида были отрезаны нуклеотиды с качеством ниже 20, и были оставлены только риды длиной не меньше 50 нуклеотидов. Для этого использовались следующие команды:

java -jar /usr/share/java/trimmomatic.jar SE -phred33 Ath_tae_CTTGTA_L003_R1_010.fastq outfile1.fastq ILLUMINACLIP:adapters.fasta:2:7:7
java -jar /usr/share/java/trimmomatic.jar SE outfile1.fastq outfile2.fastq TRAILING:20
java -jar /usr/share/java/trimmomatic.jar SE outfile2.fastq out.fastq MINLEN:50
fastqc out.fastq

Результат .

Из 2439795 ридов осталось 2324119, то есть было удалено 115676 ридов.

Обо мне
Ссылки


Valid HTML 4.01 Transitional