Практикум 9. Emboss
1)Несколько файлов в формате fasta собрать в единый файл
Команда:seqret "*.fasta" together.fasta
Исходные файлы: AAC74885.2.fasta и AAC74886.1.fasta
Полученный файл: together.fasta
2)Один файл в формате fasta с несколькими последовательностями разделить на отдельные fasta файлы
Команда: seqretsplit coding1.fasta
Исходный файл: together.fasta
Полученные файлы:
u00096.3_cds_aac73113.1_2.fasta
u00096.3_cds_aac73114.1_3.fasta
u00096.3_cds_aac73115.1_4.fasta
u00096.3_cds_aac73116.1_5.fasta
u00096.3_cds_aac73117.1_6.fasta
u00096.3_cds_aac73118.1_7.fasta
u00096.3_cds_aac73119.1_8.fasta
u00096.3_cds_aac73120.1_9.fasta
u00096.3_cds_aac73121.1_10.fasta
u00096.3_cds_aac73122.1_11.fasta
4)Транслировать кодирующие последовательности, лежащие в одном fasta файле, в аминокислотные, используя указанную таблицу генетического кода. Результат - в одном fasta файле.
Команда: transeq together.fasta trans.fasta -table 0
Исходный файл: together.fasta
Полученный файл: trans.fasta
5)Транслировать данную нуклеотидную последовательность в шести рамках.
Команда: transeq AAC74885.2.fasta task5.fasta -frame 6 -table 0
Исходный файл: AAC74885.2.fasta
Полученный файл: task5.fasta
6)Перевести выравнивание и из fasta формате в формат .msf
Команда: seqret align_gene.fasta msf::align_msf.msf
Исходный файл: align_gene.fasta
Полученный файл: align_msf.msf
7)Выдать в выходной поток число совпадающих букв между второй последовательностью выравнивания и всеми остальными
(на выходе только имя последовательности и число)
Команда:infoalign align_gene.fasta -refseq 2 -only -name –idcount
Исходный файл: align_gene.fasta
Полученный файл:info
8)(featcopy) Перевести аннотации особенностей в записи формата .gb в табличный формат .gff
Команда:featcopy chromosome.gb chrom.gff
Исходный файл: chromosome.gb
Полученный файл:chrom.gff
10)Перемешать буквы в данной нуклеотидной последовательности.
Команда: shuffleseq AAC74885.2.fasta shuffle.fasta
Исходный файл: AAC74885.2.fasta
Полученный файл: shuffle.fasta
13)Найдите частоты кодонов в данных кодирующих последовательностях
Команда: cusp gene_sequences.fasta
Исходный файл: gene_sequences.fasta
Полученный файл: task13.cusp
15)(tranalign) Выровняйте кодирующие последовательности соответственно выравниванию белков - их продуктов
Команда: tranalign gene_sequences.fasta protein_alignment.fasta align_gene.fasta
Исходные файлы: gene_sequences.fasta и protein_alignment.fasta
Полученный файл: align_gene.fasta
17)Удалите символы гэпов и другие посторонние символы из последовательности.
Команда:degapseq alignment.fasta nogap.fasta
Исходный файл: alignment.fasta
Полученный файл: nogap.fasta
19)Создайте три случайных нуклеотидных последовательностей длины сто
Команда:makenucseq -amount 3 -length 100
Полученный файл: makeseq.fasta