EMBOSS: пакет программ для анализа последовательностей

Практикум 9

Задание 1.Несколько файлов в формате fasta собрать в единый файл

     Исходные файлы: AAC74885.2.fasta, AAC74886.1.fasta, AAC74887.1.fasta, mylist.txt
     Команда: "seqret @mylist.txt -outseq result.fasta"
     Результат: result.fasta


Задание 2.Один файл в формате fasta с несколькими последовательностями разделить на отдельные fasta файлы

     Исходные файлы: coding1.fasta
     Команда: "seqretsplit coding1.fasta"
 Результат: u00096.3_cds_aac73113.1_2.fasta, u00096.3_cds_aac73114.1_3.fasta, u00096.3_cds_aac73115.1_4.fasta, u00096.3_cds_aac73116.1_5.fasta, u00096.3_cds_aac73117.1_6.fasta, u00096.3_cds_aac73118.1_7.fasta, u00096.3_cds_aac73119.1_8.fasta, u00096.3_cds_aac73120.1_9.fasta, u00096.3_cds_aac73121.1_10.fasta, u00096.3_cds_aac73122.1_11.fasta


Задание 3. Из файла с хромосомой в формате .gb вырезать три кодирующих последовательности по указанным координатам "от", "до", "ориентация" и сохранить в одном fasta файле

     Исходные файлы: Escherichia coli str. K-12 substr. MG1655, mylist2.txt
     Команда: "seqret @mylist2.txt -outseq z3.fasta"
     Результат: z3.fasta


Задание 4. Транслировать кодирующие последовательности, лежащие в одном fasta файле, в аминокислотные, используя указанную таблицу генетического кода. Результат - в одном fasta файле

     Исходные файлы: z3.fasta
     Команда: "transeq -table 0 -sequence z3.fasta -outseq z4.fasta"
     Результат: z4.fasta


Задание 5. Транслировать данную нуклеотидную последовательность в шести рамках

     Исходные файлы: AAC74885.2.fasta
     Команда: "transeq -sequence AAC74885.2.fasta -frame 6 -outseq z5.fasta"
     Результат: z5.fasta


Задание 6. Перевести выравнивание и из fasta формате в формат .msf

     Исходные файлы: alignment.fasta
     Команда: "seqret alignment.fasta msf::alignment.msf"
     Результат: alignment.msf


Задание 7. Выдать в файл число совпадающих букв между второй последовательностью выравнивания и всеми остальными (на выходе только имя последовательности)

     Исходные файлы: alignment.fasta
     Команда: "infoalign alignment.fasta -refseq 2 -only -name -idcount"
     Результат: alignment.infoalign


Задание 8. (featcopy) Перевести аннотации особенностей в записи формата .gb в табличный формат .gff

     Исходные файлы: chromosome.gb
     Команда: "featcopy chromosome.gb -outfeat z8.gff"
     Результат: z8.gff


Задание 9. (extractfeat) Из данного файла с хромосомой в формате .gb получить fasta файл с кодирующими последовательностями; (*) добавить в описание каждой последовательности функцию белка (из поля product)

     Исходные файлы: sequence.gb
     Команда: "extractfeat sequence.gb -type CDS -describe product -outseq z9.fasta"
     Результат: z9.fasta


Задание 10. Перемешать буквы в данной нуклеотидной последовательности.

     Исходные файлы: AAC74885.2.fasta
     Команда: "shuffleseq AAC74885.2.fasta -outseq z10.fasta"
     Результат: z10.fasta


Задание 13. Найти частоты кодонов в данных кодирующих последовательностях

     Исходные файлы: z3.fasta
     Команда: "cusp z3.fasta z13"
     Результат: z13


Задание 15. (tranalign) Выровняйте кодирующие последовательности соответственно выравниванию белков - их продуктов

     Исходные файлы: gene_sequences.fasta, protein_alignment.fasta
     Команда: "tranalign -aseq gene_sequences.fasta -bseq protein_alignment.fasta -out z15.fasta"
     Результат: z15.fasta


Задание 16. Постройте локальное множественное выравнивание трех нуклеотидных последовательностей

     Исходные файлы: AAC74885.2.fasta, AAC74886.1.fasta, AAC74887.1.fasta, mylist3.txt
     Команда: "edialign @mylist3.txt -revcomp -outfile z16.fasta -outseq out16.fasta"
     Результат: z16.fasta, out16.fasta


Задание 17. Удалите символы гэпов и другие посторонние символы из последовательности

     Исходные файлы: out16.fasta
     Команда: "degapseq out16.fasta z17.fasta"
     Результат: z17.fasta


Задание 18. Переведите символы конца строки в формат unix

     Исходные файлы: z13
     Команда: "noreturn z13 z18"
     Результат: z18


Задание 19. Создайте три случайных нуклеотидных последовательностей длины сто

     Исходные файлы: -
     Команда: "makenucseq -amount 3 -length 100 -outseq z19.fasta"
     Результат: z19.fasta


Задание 20. Файл с ридами sra_data.fastq в формате fastq перевести в формат fasta

     Исходные файлы:
     Команда: "seqret sra_data.fastq fasta::sra_data.fasta"
     Результат: sra_data.fasta



Назад
© Петрова Юлия 2016