Практикум 9. Пакет программ EMBOSS.
Задача 1. - bash-script
Скрипт проверяет, сколько находок с E-value < 0.1 в среднем находит blastn для случайной последовательности данной длины в данном геноме.
Скрипт принимает два аргумента: название входного файла с геномом (fasta-формат) и длина случайной последовательности. Пример использования:
$ ./pr9_scr1.sh in.fasta 10000 Create random nucleotide sequences Building a new DB, current time: 11/11/2019 23:30:01 New DB name: tmp_DB New DB title: in.fasta Sequence type: Nucleotide Keep Linkouts: T Keep MBits: T Maximum file size: 1000000000B Adding sequences from FASTA; added 1 sequences in 0.00590897 seconds. Average number of findings: 0.07
Задача 4. - bash-script
По аннотированному файлу в формате gb (из GenBank или RefSeq) или embl (из ENA) создаётся файл с кодирующими последовательностями в формате fasta с добавлением в описание каждой последовательности продукта трансляции (если он указан).
Скрипт принимает два аргумента: названия входного файла и выходного файла. Пример использования:
$ ./pr9_scr4.sh in.gb out.fasta