Практикум 9. Emboss

1)Несколько файлов в формате fasta собрать в единый файл

Команда:seqret "*.fasta" together.fasta
Исходные файлы: AAC74885.2.fasta и AAC74886.1.fasta
Полученный файл: together.fasta

2)Один файл в формате fasta с несколькими последовательностями разделить на отдельные fasta файлы

Команда: seqretsplit coding1.fasta
Исходный файл: together.fasta
Полученные файлы:
u00096.3_cds_aac73113.1_2.fasta
u00096.3_cds_aac73114.1_3.fasta
u00096.3_cds_aac73115.1_4.fasta
u00096.3_cds_aac73116.1_5.fasta
u00096.3_cds_aac73117.1_6.fasta
u00096.3_cds_aac73118.1_7.fasta
u00096.3_cds_aac73119.1_8.fasta
u00096.3_cds_aac73120.1_9.fasta
u00096.3_cds_aac73121.1_10.fasta
u00096.3_cds_aac73122.1_11.fasta

4)Транслировать кодирующие последовательности, лежащие в одном fasta файле, в аминокислотные, используя указанную таблицу генетического кода. Результат - в одном fasta файле.

Команда: transeq together.fasta trans.fasta -table 0
Исходный файл: together.fasta
Полученный файл: trans.fasta

5)Транслировать данную нуклеотидную последовательность в шести рамках.

Команда: transeq AAC74885.2.fasta task5.fasta -frame 6 -table 0
Исходный файл: AAC74885.2.fasta
Полученный файл: task5.fasta

6)Перевести выравнивание и из fasta формате в формат .msf

Команда: seqret align_gene.fasta msf::align_msf.msf
Исходный файл: align_gene.fasta
Полученный файл: align_msf.msf

7)Выдать в выходной поток число совпадающих букв между второй последовательностью выравнивания и всеми остальными (на выходе только имя последовательности и число)

Команда:infoalign align_gene.fasta -refseq 2 -only -name –idcount
Исходный файл: align_gene.fasta
Полученный файл:info

8)(featcopy) Перевести аннотации особенностей в записи формата .gb в табличный формат .gff

Команда:featcopy chromosome.gb chrom.gff
Исходный файл: chromosome.gb
Полученный файл:chrom.gff

10)Перемешать буквы в данной нуклеотидной последовательности.

Команда: shuffleseq AAC74885.2.fasta shuffle.fasta
Исходный файл: AAC74885.2.fasta
Полученный файл: shuffle.fasta

13)Найдите частоты кодонов в данных кодирующих последовательностях

Команда: cusp gene_sequences.fasta
Исходный файл: gene_sequences.fasta
Полученный файл: task13.cusp

15)(tranalign) Выровняйте кодирующие последовательности соответственно выравниванию белков - их продуктов

Команда: tranalign gene_sequences.fasta protein_alignment.fasta align_gene.fasta
Исходные файлы: gene_sequences.fasta и protein_alignment.fasta
Полученный файл: align_gene.fasta

17)Удалите символы гэпов и другие посторонние символы из последовательности.

Команда:degapseq alignment.fasta nogap.fasta Исходный файл: alignment.fasta
Полученный файл: nogap.fasta

19)Создайте три случайных нуклеотидных последовательностей длины сто

Команда:makenucseq -amount 3 -length 100
Полученный файл: makeseq.fasta