Учебный сайт Орлова Артёма

Практикум 9. Пакет программ EMBOSS.

Задача 1. - bash-script

Скрипт проверяет, сколько находок с E-value < 0.1 в среднем находит blastn для случайной последовательности данной длины в данном геноме.

Скрипт принимает два аргумента: название входного файла с геномом (fasta-формат) и длина случайной последовательности. Пример использования:

$ ./pr9_scr1.sh in.fasta 10000
Create random nucleotide sequences


Building a new DB, current time: 11/11/2019 23:30:01
New DB name:   tmp_DB
New DB title:  in.fasta
Sequence type: Nucleotide
Keep Linkouts: T
Keep MBits: T
Maximum file size: 1000000000B
Adding sequences from FASTA; added 1 sequences in 0.00590897 seconds.
Average number of findings:
0.07

Задача 4. - bash-script

По аннотированному файлу в формате gb (из GenBank или RefSeq) или embl (из ENA) создаётся файл с кодирующими последовательностями в формате fasta с добавлением в описание каждой последовательности продукта трансляции (если он указан).

Скрипт принимает два аргумента: названия входного файла и выходного файла. Пример использования:

$ ./pr9_scr4.sh in.gb out.fasta