Написать на python и/или bash скрипт, решающий одну из задач.
0. Упражнения по EMBOSS
...
9.(extractfeat) Из данного файла с хромосомой в формате gb или embl получить fasta файл с кодирующими последовательностями:
- extractfeat file.gb -type CDS -out file.fasta
Задание
4. По данному аннотированному файлу в формате gb (из GenBank или RefSeq) или embl (из ENA) создать файл с кодирующими последовательностями в формате fasta,
добавив в описание каждой последовательности функцию белка (из поля product).
Данная задача похожа на упражнения 9 (см. выше), которое было выполнено с помощью команды extractfeat.Отличие только в
добавлении в аннотацию кодирующих последовательностей названия белка.
У feature extractfeat есть опция -describe, которая позволяет добавить в описание информацию, которая содержится под тэгом.
В скобках будут указаны названия белков, указанные в /product.
- extractfeat -type CDS -describe product file.gb file.fasta
Соответствующий скрипт:Скрипт
Исходный файл
Файл с белками