На данном этапе были удалены короткие чтения, остатки адаптеров и плохие концы. В итоге осталось всего 9.376.078 чтений, что более чем в два раза меньше изначального количества. Команды описаны ниже.
На данном этапе мы подготовили k-меры длины 29. Команда описана ниже.
С помощью velvetg была произведена сборка. На выход дан файл contigs.fa с контигами и stats.txt со статистикой по контигам. Из него мы можем выудить некоторую интересующую нас информацию. Полученный граф имел 1150 вершин. Параметр N50 равен 2942. Среднее покрытие равно 598,28, а медианное - 20, что говорит о крайне неравномерном распределении.
ID | Длина | Покрытие | Особенности |
2 | 15418 | 51,14 | Аномально большой размер |
36 | 15093 | 37,14 | Аномально большой размер |
62 | 10741 | 38,16 | Аномально большой размер |
307 | 1 | 1760 | Большое покрытие |
200 | 1 | 1848 | Большое покрытие |
417 | 1 | 6436 | Аномально большое покрытие |
1133 | 1 | 1 | Аномально низкое покрытие |
1134 | 3 | 1 | Аномально низкое покрытие |
1135 | 4 | 1 | Аномально низкое покрытие |
Далее посредством megablast был произведён анализ наложения трёх наибольших контигов на хромосому. В таблице ниже представленны параметры.
ID | Max score | Total score | Cover | E-value | Ident | Len | Gaps |
2 | 10966 | 10966 | 2% | 0 | 80% | 15461 | 350 |
36 | 2907 | 5147 | 1% | 0 | 76% | 9734 | 335 |
62 | 1279 | 2378 | 0% | 0 | 76% | 5441 | 250 |
Данный контиг наложился прямо. Несмотря на то, что он имеет крайне большой размер, разрывов в нём не имеется
Данный контиг наложился прямо. Он располагается возле места, которое считается началом кольцевой хромосомы, но не выходит за него (иначе был бы разрыв). В связи с нецельностью контига его настоящая длина приверно на 5400 нуклеотидов меньше, чем указанная в пункте 3
Данный контиг наложился обратно. В связи с нецельностью контига его настоящая длина приверно на 5400 нуклеотидов меньше, чем указанная в пункте 3, что может позволить вынести его из группы "больших"
Команда | Что делала |
java -jar /usr/share/java/trimmomatic.jar SE -phred33 SRR4240389.fastq SRR420389_removed.fastq ILLUMINACLIP:adapters.fasta:2:7:7 | Убирает адапторы |
java -jar /usr/share/java/trimmomatic.jar SE -phred33 SRR420389_removed.fastq SRR420389_rem.fastq TRAILING:20 MINLEN:30 | Убирает риды меньше 30 и выполняет подрезание по качеству |
velveth /vel 29 -fastq -short SRR420389_rem.fastq.fastq | Создаёт k-меры |
/vel velveth | Выполняет сборку |