Практикум 15.

De novo

Скачивание чтений

Был скачен архив с чтениями при помощи команды:

 wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR424/006/SRR4240356/SRR4240356.fastq.gz
1. Подготовка чтений программой trimmomatic

Возможные остатки адептеров были удалены командой:

java -jar /usr/share/java/trimmomatic.jar SE -threads 10 -phred33 SRR4240356.fastq.gz SRR4240356_clean.fastq.gz ILLUMINACLIP:adapters.fasta:2:7:7

Остатками адаптеров оказались 2,04% последовательностей чтений.

C правых концов чтений были удалены нуклеотиды с качеством ниже 20 при помощи команды:

java -jar /usr/share/java/trimmomatic.jar SE -phred33 SRR4240356_clean.fastq.gz SRR4240356_final.fastq.gz TRAILING:20 MINLEN:32
  1. Было удалено 305092 чтений (4,15% от общего количества)

  2. Размер файла до очистки составилял 167M, а после 155M

2. Velveth

k-меры длиной k=31 были созданы и помещены в директорию velveth при помощи команды:

velveth velveth 31 -fastq -short SRR4240356_final.fastq.gz
3. Velvetg

Команда для запуска velvetg:

 velvetg velveth

Для данной сборки параметр N50 = 65554. В Таблице 1 приведены длины 3-x самых больших контигов и их покрытие:

IDДлинаПокрытие
811196238.660197
610748834.174029
108093937.524173
Таблица 1. Длины, покрытие самых длинных контигов.

Были обнаружены контиги с аномально большим покрытием(421.761905 при длине 21 нуклеотид) или аномально малым покрытием(1.000000 при длинне в 1 нуклеотид).

Анализ

В результате выравнивания алгоритмом megablast были получены карты локального сходства трёх самых длинных контигов на геном Buchnera aphidicola.

Рис.1DotPlot для 8 контига.

Рис.1DotPlot для 6 контига.

Рис.1DotPlot для 10 контига.