Кодировка UTF-8 FastQC Статистика чтений Trimmomatic Проводит очистку чтений SE Одноконцевой режим -phred33 Кодировка качества в формате Phred33 LEADING:N Отрезает с начала рида все нуклеотиды с качеством меньше N TRAILING:N Отрезает с конца рида все нуклеотиды с качеством меньше N MINLEN:N Убирает риды длиной меньше 50 hisat2-build infile.fasta indexed Строит индекс генома в infile.fasta и создаёт файлы indexed.1.ht2, ... indexed.8.ht2 hisat2 Картирует риды на геном -x Мнемоника индексных файлов -q Файл с ридами -S Файл, куда запишет выравнивания в SAM --no-spliced-alignment Запрещает сплайсированное выравнивание (то есть большие одинаковые гэпы у рида и генома) --no-softclip Запрещает концам ридов не выравниваться на геном samtools view Показывает выравнивание (без опций) -b вывод в формате .bam -o файл вывода samtools sort Сортирует выравнивание -O Устанавливает, что вывод будет в sam, bam или cram -o Файл вывода -T Мнемоника временных файлов samtools index Индексирует выравнивание для ускорения работы samtools depth Вычисляет глубину прочтений каждой позиции -r Определяет конкретный регион, для которого надо посчитать глубину samtools mpileup Переводит файл с выравниваем в формат pileup (для каждой позиции определяет все прочтённые буквы) -o Файл вывода -u Файл несжатый -v Вывод в формате VCF -f Референсный файл в формате fasta bcftools call Осуществляет вызов SNP и инделей (из файла vcf выбирает только те позиции, где есть альтернативные от референса основания) -o Файл вывода -с Определяет оригинальный алгоритм вызова -v Выводит только варианты -Ov Определяет формат вывода как несжатый vcf convert2annovar.pl Переводит варианты в vcf в совместимый с annovar формат -format vcf4 Формат vcf4, файл ввода для annovar annotate_variation.pl Аннотирует варианты по определённой базе данных -out Файл вывода -build[ver] Сборка генома -dbtype Название базы данных -filter Режим фильтрации: отбирает только те варианты, которые идентичны записи в БД (начало, конец, нуклеотиды) -regionanno Режим по регионам: отбирает варианты, перекрывающиеся по координатам с записями в БД (не обращает внимания на точное совпадение по позициям и нуклеотидам)