Пакет программ EMBOSS

  1. Несколько файлов в формате fasta собрать в единый файл.

  2. Исходные файлы:

    1n77_c.fasta

    itog.fasta

    Команда: seqret "*.fasta" it.fasta

    Конечный файл:

    it.fasta

  3. Один файл в формате fasta с несколькими последовательностями разделить на отдельные fasta файлы

  4. Исходный файл:

    primer.fasta

    Команда: seqretsplit primer.fasta

    Конечные файлы:

    sequence_3_7.fasta

    sequence_65_69.fasta

  5. Создать три случайных нуклеотидных последовательностей длины 100

  6. Команда: makenucseq -amount 3 -length 500 seq.fasta

    Конечный файл:

    seq.fasta

  7. Транслировать (с первого кодона, то есть в первой рамке) кодирующие последовательности, лежащие в одном fasta файле, в аминокислотные, используя указанную таблицу генетического кода, и положить результат в один fasta файл

  8. Исходный файл:

    scaf1.fasta

    Команда: transeq scaf1.fasta transl.fasta -table 3

    Конечный файл:

    transl.fasta

  9. Перевести выравнивание из формата fasta в формат msf

  10. Исходный файл:

    ggt.fasta

    Команда: seqret ggt.fasta msf::ggt.msf

    Конечный файл:

    ggt.msf

  11. Выдать в файл число совпадающих букв между второй последовательностью выравнивания и всеми остальными (на выходе только имена последовательностей и числа)

  12. Исходный файл:

    ggt.fasta

    Команда: infoalign ggt.fasta -refseq 2 -only -name -idcount ggt.infoalign

    Конечный файл:

    ggt.infoalign

  13. (featcopy) Перевести аннотации особенностей из файла формата gb или embl в табличный формат gff

  14. Исходный файл:

    sequence.gb

    Команда: featcopy sequence.gb sequence.gff

    Конечный файл:

    sequence.gff

  15. (extractfeat) Из данного файла с хромосомой в формате gb или embl получить fasta файл с кодирующими последовательностями

  16. Исходный файл:

    sequence2.gb

    Команда: extractfeat sequence2.gb rt.fasta

    Конечный файл:

    rt.fasta

  17. Перемешать буквы в данной нуклеотидной последовательности

  18. Исходный файл:

    scaf1.fasta

    Команда: shuffleseq scaf1.fasta sc.fasta

    Конечный файл:

    sc.fasta

  19. Найти частоты кодонов в данных кодирующих последовательностях

  20. Исходный файл:

    cod.fasta

    Команда: cusp cod.fasta kust.fasta

    Конечный файл:

    kust.fasta

  21. Удалить символы гэпов из выравнивания (превратив его тем самым снова в набор невыровненных последовательностей)

  22. Исходный файл:

    vir.fasta

    Команда: degapseq vir.fasta vip.fasta

    Конечный файл:

    vip.fasta

  23. (*) По данному аннотированному файлу в формате gb (из GenBank или RefSeq) или embl (из ENA) создать файл с кодирующими последовательностями в формате fasta, добавив в описание каждой последовательности функцию белка (из поля product)

  24. Исходный файл:

    sequence2.gb

    Команда: extractfeat sequence2.gb -only CDS -describe product lo.fasta

    Конечный файл:

    lo.fasta


    © Иззи Антон,2018