Для анализа качества чтений была использована программа FastQC (версия с графическим интерфейсом). Полученный отчет в формате .html Вы можете посмотреть здесь. Качество ридов в начале оставляет желать лучшего, а в середине дела обстоят лучше. Средняя длина последовательности составляет 100-102 нуклеотидa. GC-состав - 35%.
Поскольку чтения были получены на Illumina 1.9, использовался формат phred33. Программе trimmomatic была подана на вход команда:
java -jar trimmomatic-0.32.jar SE -phred33 1.fastq output.fastq ILLUMINACLIP:adapters.fa:2:7:7 TRAILING:20 MINLEN:50
Далее на новом очищенном множестве ридов была запущена программа FastQC, результат работы которой можно увидеть здесь. Можно заметить, что качество чтений несколько улучшилось. Теперь средняя длина чтений составляет 50-101 нуклеотид. GC-состав не изменился, а точность определения нуклеотидов возросла.
Дата последнего обновления: 15.09.2014
Copyright © Кузнецова Мария, 2013.