Анализ качества и очистка чтений
Анализ качества чтений
Для практикума использовался файл с чтениями из
резуховидки . В виду большого размера,
я не имею возможности разместить его здесь. Первым делом необходимо было проверить качество чтений с помощью
FastQC.
Html-вывод доступен по
ссылке.
Рис. 1. Графическое представления качества ридов
Очистка чтений
Для очистики чтений необходимо было использовать
Trimmomatic, разобравшись с программой на их
официальном сайте,
была составлена следующая команда:
java -jar usr/share/java/trimmomatic-0.32.jar SE -phred33 Ath_tae_CTTGTA_L003_R2_004.fastq.gz output.fastq ILLUMINACLIP:adapters.fasta:2:7:7 TRAILING:20 MINLEN:50.
Она удаляет последовательность адаптеров, отрезает с конца каждого прочтения нуклеотиды с качеством ниже 20 и оставляет прочтения только длиннее 50 нуклеотидов.
Форматов был выбран phred33, так как использовалась Illumina 1.9. Перед использованием был создан свой файл с адаптерами.
Результат представлен на
странице.
Рис. 2. Графическое представления качества ридов после обработки с помощью trimmomatic
После обработки из 4000000 последовательностей осталось 9515.
Просвиров Кирилл. Дата последнего изменения: 4 октября 2014.