Написать на python и/или bash скрипт, решающий одну из задач.

0. Упражнения по EMBOSS

... 9.(extractfeat) Из данного файла с хромосомой в формате gb или embl получить fasta файл с кодирующими последовательностями:

Задание

4. По данному аннотированному файлу в формате gb (из GenBank или RefSeq) или embl (из ENA) создать файл с кодирующими последовательностями в формате fasta, добавив в описание каждой последовательности функцию белка (из поля product).

Данная задача похожа на упражнения 9 (см. выше), которое было выполнено с помощью команды extractfeat.Отличие только в добавлении в аннотацию кодирующих последовательностей названия белка. У feature extractfeat есть опция -describe, которая позволяет добавить в описание информацию, которая содержится под тэгом. В скобках будут указаны названия белков, указанные в /product.

Соответствующий скрипт:Скрипт
Исходный файл
Файл с белками