Третий семестр

Интересно и полезно

Главная

Семестры

Ссылки

О себе

Практикум№1(4 блок)

Анализ качества и очистка чтений

Первым делом нам ну)(но было скачать файл с чтениями генома резуховидки.Далее мы сделали контроль качества скачанных чтений программои FastQC. html-отчет

В данном задании ну)\(но было сделать тримминг (очистку) скачанных чтений с помощью программы Trimmomatic: а именно удалить последовательности адаптеров, отрезать с конца каждого прочтения нуклеотиды с качеством ниже 20, оставить только прочтения длиной не меньше 50 нуклеотидов. Формат fastqc - phred33.

Для этого мы использовали команды:

fastqc Ath_tae_CTTGTA_L003_R2_003.fastq
java -jar /usr/share/java/trimmomatic.jar SE Ath_tae_CTTGTA_L003_R2_003.fastq out.fastq ILLUMINACLIP:adapters.fasta:2:7:7
java -jar /usr/share/java/trimmomatic.jar SE out.fastq out.fastq TRAILING:20
java -jar /usr/share/java/trimmomatic.jar SE out.fastq out.fastq MINLEN:50
fastqc out.fastq

Далле мы сделала, как и в первом задании, анализ качества очищенных чтений с помощью FastQC. Ссылка на новый html-отчет.

Количество чтений от 4 миллионов сократилось до примерно 3.8 миллионов. По результатам отчистки график оценки качества чтений нуклеотидов изменился, графики Per tile sequence quality и Per sequence quality scores не изменились(или не значительно), график Per base sequence content изменился чуть более заметно, но процент содержания различных нуклеотидов остался на таком )\(е уровне. Но в результате наших действий график Sequence Length Distribution изменился сильно. В остальных графиках изменения не наблюдаются.