Третий семестр |
|||||||
Интересно и полезно |
Главная |
Семестры |
Ссылки |
О себе |
|||
Практикум№1(4 блок) Анализ качества и очистка чтений Первым делом нам ну)(но было скачать файл с чтениями генома резуховидки.Далее мы сделали контроль качества скачанных чтений программои FastQC. html-отчет В данном задании ну)\(но было сделать тримминг (очистку) скачанных чтений с помощью программы Trimmomatic: а именно удалить последовательности адаптеров, отрезать с конца каждого прочтения нуклеотиды с качеством ниже 20, оставить только прочтения длиной не меньше 50 нуклеотидов. Формат fastqc - phred33. Для этого мы использовали команды: fastqc Ath_tae_CTTGTA_L003_R2_003.fastq java -jar /usr/share/java/trimmomatic.jar SE Ath_tae_CTTGTA_L003_R2_003.fastq out.fastq ILLUMINACLIP:adapters.fasta:2:7:7 java -jar /usr/share/java/trimmomatic.jar SE out.fastq out.fastq TRAILING:20 java -jar /usr/share/java/trimmomatic.jar SE out.fastq out.fastq MINLEN:50 fastqc out.fastq Далле мы сделала, как и в первом задании, анализ качества очищенных чтений с помощью FastQC. Ссылка на новый html-отчет. Количество чтений от 4 миллионов сократилось до примерно 3.8 миллионов. По результатам отчистки график оценки качества чтений нуклеотидов изменился, графики Per tile sequence quality и Per sequence quality scores не изменились(или не значительно), график Per base sequence content изменился чуть более заметно, но процент содержания различных нуклеотидов остался на таком )\(е уровне. Но в результате наших действий график Sequence Length Distribution изменился сильно. В остальных графиках изменения не наблюдаются. |