Сборка генома de novo

Сборка генома de novo

Часть 1. Подготовка чтений

Таблица 1. Исполненные команды

Команда

Что делает

gunzip -d SRR4240387.fastq.gz Распаковка скачанного архива
fastqc SRR4240387.fastq Анализ файла с ридами с помощью программы FastQC
cat *.fa >> adapters.fasta Скопированные файлы с адаптерами для Illumina были объединены в один файл
java -jar /nfs/srv/databases/ngs/suvorova/trimmomatic/trimmomatic-0.30.jar SE -phred33 SRR4240387.fastq reads_fixed.fastq ILLUMINACLIP:adapters.fasta:2:7:7 TRAILING:20 MINLEN:30 Удаляет адаптеры из файлы с ридами, а затем удаляет нуклеотиды с качеством чтения <20 и риды короче 30 нуклеотидов
fastqc reads_fixed.fastq Анализ файла с ридами с помощью FastQC после работы программы trimmomatic

Рисунок 1. Per base quality до обработки программой trimmomatic

Из рисунка 1 видно, что риды плохого качества, поэтому было решено воспользоваться программой trimmomatic.

Рисунок 2. Per base quality после обработки программой trimmomatic

Часть 2. Подготовка k-меров и сборка контигов

Таблица 2. Исполненные команды

Команда

Что делает

velveth 29mers 29 -fastq -short reads_fixed.fastq Создание библиотеки контигов в папке 29mers
velvetg 29mers/ Получение контигов

Таблица 3. Результат работы velvet

Характеристика

Значение

Длина графа 1156
N50 1367
Длина 633.756
Саммые длинные контиги ID: 78 | Длина: 7399 | Покрытие: ~33.422
ID: 26 | Длина: 6230 | Покрытие: ~25.779
ID: 21 | Длина: 5261 | Покрытие: ~23.969
Аномальные контиги ID: 125 | Длина: 280 | Покрытие: ~406.414
ID: 4 | Длина: 1156 | Покрытие: ~253.037
ID: 875 | Длина: 69 | Покрытие: ~2.029

Часть 3. Анализ контигов с помощью Megablast

Рисунок 3. Карта локального сходства контига №78 и хромосомы Buchnera aphidicola

Рисунок 4. Карта локального сходства контига №26 и хромосомы Buchnera aphidicola

Рисунок 5. Карта локального сходства контига №21 и хромосомы Buchnera aphidicola

Таблица 4. Характеристики сравнений самых длинных контигов с Buchnera aphidicola (GenBank/EMBL AC — CP009253)

ID

Координаты

Мисматчи

Гэпы

Покрытие, %

78 35162..42578 1219 66 99
26 536550..542787 1248 111 99
21 584329..587054 677 108 51

По картам локальных сходств видно, что контиги 78 и 26 инвертированы относительно последовательности генома Buchnera aphidicola, а контиг 21 соответствует прямой цепи хромосомы. Для каждого контига было построено по 1 выравниванию без существенных разрывов.


Полезные ссылки:

Главная страница;

Профайл;

Учебные реалии, или список семестров;

Официальный сайт ФББ МГУ.


© Daniel Igumnov, 2018