Упражнения на Emboss

1. Несколько файлов в формате .fasta собрать в единый файл

$ seqret "*_dicdi.fasta" dicdi.fasta

Исходные файлы: *_dicdi.fasta

Результат: dicdi.fasta

2. Один файл в .fasta с несколькими последовательностями разделить на отдельные .fasta файлы

$ seqretsplit dicdi.fasta -auto

Исходные файлы: dicdi.fasta

Результат: полученные файлы собраны в этой директории

4. Транслирование нуклеотидной последовательности

$ transeq p4.fasta p4_result.fasta -frame=1

Исходные файлы: p4.fasta

Результат: p4_result.fasta

5. Вывести открытые рамки длиной не менее заданной, имеющиеся в данной нуклеотидной последовательности

$ getorf -minsize 9 p5.fasta p5_result.fasta

Исходные файлы: p5.fasta

Результат: p5_result.fasta

6. Перевод выравнивания из .fasta в .msf

$ seqret alignment.fasta -outseq msf::alignment.msf

Исходные файлы: alignment.fasta

Результат: alignment.msf

7. Число совпадающих букв

$ infoalign alignment.fasta -refseq 2 -outfile p7_result.txt -only -name -idcount

Исходные файлы: alignment.fasta

Результат: p7_result.txt

8. Featcopy

$ featcopy fugu.gb

Исходные файлы: fugu.gb

Результат: fugu.gff

10. Перемешать буквы в данной нуклеотидной последовательности

$ shuffleseq -sequence p10.fasta -outseq p10_result.fasta

Исходные файлы: p10.fasta

Результат: p10_result.fasta

11. Создать три случайных нуклеотидных последовательностей длины 100

$ makenucseq -length 100 -amount 3 -outseq p11_result.fasta -auto

Результат: p11_result.fasta

12. Найти частоты кодонов в данных кодирующих последовательностях

$ compseq p11_result.fasta -word 3 -outfile p12_result.txt

Исходные файлы: p11_result.fasta

Результат: p12_result.txt

14. Удалить символы гэпов из выравнивания

$ degapseq alignment.fasta p14_result.fasta

Исходные файлы: alignment.fasta

Результат: p14_result.fasta

Скрипт

Задача 4. С помощью команды extractfeat из .gb файла можно создать .fasta файл с кодирующими последовательностями с указанием функции продукта в описании:

$ extractfeat ta2.gb fasta::ta2.fasta -describe product

Исходный файл: ta2.gb

Результат: ta2.fasta