EMBOSS и локальный BLAST

Упражнения

1.Несколько файлов в формате fasta собрать в единый файл. 2.Один файл в формате fasta с несколькими последовательностями разделить на отдельные fasta файлы. 4. Транслировать (с первого кодона, то есть в первой рамке) кодирующие последовательности, лежащие в одном fasta файле, в аминокислотные, используя указанную таблицу генетического кода, и положить результат в один fasta файл. 6. Перевести выравнивание из формата fasta в формат msf. 7. Выдать в файл число совпадающих букв между второй последовательностью выравнивания и всеми остальными (на выходе только имена последовательностей и числа). 8. (featcopy) Перевести аннотации особенностей из файла формата gb или embl в табличный формат gff. 9. (extractfeat) Из данного файла с хромосомой в формате gb или embl получить fasta файл с кодирующими последовательностями. 10. Перемешать буквы в данной нуклеотидной последовательности. 11. Создать три случайных нуклеотидных последовательностей длины 100. 12. Найти частоты кодонов в данных кодирующих последовательностях.

Скрипт

Ссылка на скрипт
Скрипт выполняет задачу №4: "По данному аннотированному файлу в формате gb (из GenBank или RefSeq) или embl (из ENA) создать файл с кодирующими последовательностями в формате fasta, добавив в описание каждой последовательности функцию белка (из поля product)."
Имя файла принимается в качестве аргумента командной строки.