Наружу


Назад

Сборка de novo





Подготовка чтений

На данном этапе были удалены короткие чтения, остатки адаптеров и плохие концы. В итоге осталось всего 9.376.078 чтений, что более чем в два раза меньше изначального количества. Команды описаны ниже.

velveth

На данном этапе мы подготовили k-меры длины 29. Команда описана ниже.

Сборка

С помощью velvetg была произведена сборка. На выход дан файл contigs.fa с контигами и stats.txt со статистикой по контигам. Из него мы можем выудить некоторую интересующую нас информацию. Полученный граф имел 1150 вершин. Параметр N50 равен 2942. Среднее покрытие равно 598,28, а медианное - 20, что говорит о крайне неравномерном распределении.

Таблица с аномалиями

ID Длина Покрытие Особенности
2 15418 51,14 Аномально большой размер
36 15093 37,14 Аномально большой размер
62 10741 38,16 Аномально большой размер
307 1 1760 Большое покрытие
200 1 1848 Большое покрытие
417 1 6436 Аномально большое покрытие
1133 1 1 Аномально низкое покрытие
1134 3 1 Аномально низкое покрытие
1135 4 1 Аномально низкое покрытие

Анализ

Далее посредством megablast был произведён анализ наложения трёх наибольших контигов на хромосому. В таблице ниже представленны параметры.

ID Max score Total score Cover E-value Ident Len Gaps
2 10966 10966 2% 0 80% 15461 350
36 2907 5147 1% 0 76% 9734 335
62 1279 2378 0% 0 76% 5441 250

ID 2

Данный контиг наложился прямо. Несмотря на то, что он имеет крайне большой размер, разрывов в нём не имеется

ID 36

Данный контиг наложился прямо. Он располагается возле места, которое считается началом кольцевой хромосомы, но не выходит за него (иначе был бы разрыв). В связи с нецельностью контига его настоящая длина приверно на 5400 нуклеотидов меньше, чем указанная в пункте 3

ID 62

Данный контиг наложился обратно. В связи с нецельностью контига его настоящая длина приверно на 5400 нуклеотидов меньше, чем указанная в пункте 3, что может позволить вынести его из группы "больших"

Использованные команды

Команда Что делала
java -jar /usr/share/java/trimmomatic.jar SE -phred33 SRR4240389.fastq SRR420389_removed.fastq ILLUMINACLIP:adapters.fasta:2:7:7 Убирает адапторы
java -jar /usr/share/java/trimmomatic.jar SE -phred33 SRR420389_removed.fastq SRR420389_rem.fastq TRAILING:20 MINLEN:30 Убирает риды меньше 30 и выполняет подрезание по качеству
velveth /vel 29 -fastq -short SRR420389_rem.fastq.fastq Создаёт k-меры
/vel velveth Выполняет сборку

© Попов Алексей, 2016 г.