EMBOSS: пакет программ для анализа последовательностей

1. Несколько файлов в формате fasta собрать в единый файл

Исходные файлы: 1f7u.fasta, pr6.fasta, pr8.fasta
Команда: seqret "*.fasta" -outseq pr9_1
Результат: pr9_1.fasta

2. Один файл в формате fasta с несколькими последовательностями разделить на отдельные fasta файлы

Исходный файл: pr6.fasta
Команда: seqretsplit pr6.fasta
Результаты: v22.002.fasta, v22.fasta

3. Из файла с хромосомой в формате .gb вырезать три кодирующих последовательности по указанным координатам "от", "до", "ориентация" и сохранить в одном fasta файле

Исходные файлы: chr.gb, pr9_3.txt
Команда: seqret @pr9_3.txt -outseq pr9_3.1.fasta
Результат: pr9_3.1.fasta

4. Транслировать кодирующие последовательности, лежащие в одном fasta файле, в аминокислотные, используя указанную таблицу генетического кода. Результат - в одном fasta файле

Исходный файл: pr6.fasta
Команда: transeq pr6.fasta -outseq pr9_4.fasta"
Результат: pr9_4.fasta

5. Транслировать данную нуклеотидную последовательность в шести рамках

Исходный файл: pr8.fasta
Команда: transeq pr8.fasta -frame 6 -outseq pr9_5.fasta"
Результат: pr9_5.fasta

6. Перевести выравнивание из .fasta формата в формат .msf

Исходный файл: al.fasta
Команда: seqret al.fasta msf::pr9_6.msf
Результат: pr9_6.msf

7. Выдать в выходной поток число совпадающих букв между второй последовательностью выравнивания и всеми остальными (на выходе только имя последовательности и число)

Исходный файл: al.fasta
Команда: infoalign al.fasta -refseq 2 -only -name -idcount
Результат: al.infoalign

8. Перевести аннотации особенностей в записи формата .gb в табличный формат .gff

Исходный файл: chr.gb
Команда: "featcopy chr.gb -outfeat pr9_8.gff"
Результат: pr9_8.gff

9. Из данного файла с хромосомой в формате .gb получить fasta файл с кодирующими последовательностями; добавить в описание каждой последовательности функцию белка (из поля product)

Исходный файл: chr.gb
Команда: "extractfeat chr.gb -type CDS -describe product -outseq pr9_9.fasta"
Результат: pr9_9.fasta

10. Перемешать буквы в данной нуклеотидной последовательности

Исходный файл: pr6.fasta
Команда: "shuffleseq pr6.fasta -outseq pr9_10.fasta"
Результат: pr9_10.fasta

18. Переведите символы конца строки в формат unix

Исходный файл: 1.txt
Команда: "noreturn 1.txt task18"
Результат: task18

© Максим Григорьян, 2016