Пакет программ EMBOSS
-
Несколько файлов в формате fasta собрать в единый файл.
Исходные файлы:
1n77_c.fasta
itog.fasta
Команда: seqret "*.fasta" it.fasta
Конечный файл:
it.fasta
-
Один файл в формате fasta с несколькими последовательностями разделить на отдельные fasta файлы
Исходный файл:
primer.fasta
Команда: seqretsplit primer.fasta
Конечные файлы:
sequence_3_7.fasta
sequence_65_69.fasta
-
Создать три случайных нуклеотидных последовательностей длины 100
Команда: makenucseq -amount 3 -length 500 seq.fasta
Конечный файл:
seq.fasta
-
Транслировать (с первого кодона, то есть в первой рамке) кодирующие последовательности, лежащие в одном fasta файле, в аминокислотные, используя указанную таблицу генетического кода, и положить результат в один fasta файл
Исходный файл:
scaf1.fasta
Команда: transeq scaf1.fasta transl.fasta -table 3
Конечный файл:
transl.fasta
-
Перевести выравнивание из формата fasta в формат msf
Исходный файл:
ggt.fasta
Команда: seqret ggt.fasta msf::ggt.msf
Конечный файл:
ggt.msf
-
Выдать в файл число совпадающих букв между второй последовательностью выравнивания и всеми остальными (на выходе только имена последовательностей и числа)
Исходный файл:
ggt.fasta
Команда: infoalign ggt.fasta -refseq 2 -only -name -idcount ggt.infoalign
Конечный файл:
ggt.infoalign
-
(featcopy) Перевести аннотации особенностей из файла формата gb или embl в табличный формат gff
Исходный файл:
sequence.gb
Команда: featcopy sequence.gb sequence.gff
Конечный файл:
sequence.gff
-
(extractfeat) Из данного файла с хромосомой в формате gb или embl получить fasta файл с кодирующими последовательностями
Исходный файл:
sequence2.gb
Команда: extractfeat sequence2.gb rt.fasta
Конечный файл:
rt.fasta
-
Перемешать буквы в данной нуклеотидной последовательности
Исходный файл:
scaf1.fasta
Команда: shuffleseq scaf1.fasta sc.fasta
Конечный файл:
sc.fasta
-
Найти частоты кодонов в данных кодирующих последовательностях
Исходный файл:
cod.fasta
Команда: cusp cod.fasta kust.fasta
Конечный файл:
kust.fasta
-
Удалить символы гэпов из выравнивания (превратив его тем самым снова в набор невыровненных последовательностей)
Исходный файл:
vir.fasta
Команда: degapseq vir.fasta vip.fasta
Конечный файл:
vip.fasta
-
(*) По данному аннотированному файлу в формате gb (из GenBank или RefSeq) или embl (из ENA) создать файл с кодирующими последовательностями в формате fasta, добавив в описание каждой последовательности функцию белка (из поля product)
Исходный файл:
sequence2.gb
Команда: extractfeat sequence2.gb -only CDS -describe product lo.fasta
Конечный файл:
lo.fasta
© Иззи Антон,2018