EMBOSS: пакет программ для анализа последовательностей
1. Несколько файлов в формате fasta собрать в единый файл
Исходные файлы: 1f7u.fasta, pr6.fasta, pr8.fasta
Команда: seqret "*.fasta" -outseq pr9_1
Результат: pr9_1.fasta
2. Один файл в формате fasta с несколькими последовательностями разделить на отдельные fasta файлы
Исходный файл: pr6.fasta
Команда: seqretsplit pr6.fasta
Результаты: v22.002.fasta, v22.fasta
3. Из файла с хромосомой в формате .gb вырезать три кодирующих последовательности по указанным координатам "от", "до", "ориентация" и сохранить в одном fasta файле
Исходные файлы: chr.gb, pr9_3.txt
Команда: seqret @pr9_3.txt -outseq pr9_3.1.fasta
Результат: pr9_3.1.fasta
4. Транслировать кодирующие последовательности, лежащие в одном fasta файле, в аминокислотные, используя указанную таблицу генетического кода. Результат - в одном fasta файле
Исходный файл: pr6.fasta
Команда: transeq pr6.fasta -outseq pr9_4.fasta"
Результат: pr9_4.fasta
5. Транслировать данную нуклеотидную последовательность в шести рамках
Исходный файл: pr8.fasta
Команда: transeq pr8.fasta -frame 6 -outseq pr9_5.fasta"
Результат: pr9_5.fasta
6. Перевести выравнивание из .fasta формата в формат .msf
Исходный файл: al.fasta
Команда: seqret al.fasta msf::pr9_6.msf
Результат: pr9_6.msf
7. Выдать в выходной поток число совпадающих букв между второй последовательностью выравнивания и всеми остальными (на выходе только имя последовательности и число)
Исходный файл: al.fasta
Команда: infoalign al.fasta -refseq 2 -only -name -idcount
Результат: al.infoalign
8. Перевести аннотации особенностей в записи формата .gb в табличный формат .gff
Исходный файл: chr.gb
Команда: "featcopy chr.gb -outfeat pr9_8.gff"
Результат: pr9_8.gff
9. Из данного файла с хромосомой в формате .gb получить fasta файл с кодирующими последовательностями; добавить в описание каждой последовательности функцию белка (из поля product)
Исходный файл: chr.gb
Команда: "extractfeat chr.gb -type CDS -describe product -outseq pr9_9.fasta"
Результат: pr9_9.fasta
10. Перемешать буквы в данной нуклеотидной последовательности
Исходный файл: pr6.fasta
Команда: "shuffleseq pr6.fasta -outseq pr9_10.fasta"
Результат: pr9_10.fasta
18. Переведите символы конца строки в формат unix
Исходный файл: 1.txt
Команда: "noreturn 1.txt task18"
Результат: task18
© Максим Григорьян, 2016