Ралдугина Василиса

Студентка Факультета биоинженерии и биоинформатики

МГУ имени М.В. Ломоносова

Обо мне

Главная

Сайт ФББ МГУ

Emboss

Задание 1. Несколько файлов в формате fasta собрать в единый файл


Входные файлы: файл 1 , файл 2 , файл 3 лежали в папке seq.
Команда bash: seqret "seq/*" all.fasta
Выходной файл all.fasta

Задание 2.Один файл в формате fasta с несколькими последовательностями разделить на отдельные fasta файлы


Входной файл all.fasta.
Команда bash : seqret all.fasta -ossingle2 -auto
Выходные файлы файл 1 , файл 2 , файл 3

Задание 3. Из файла с хромосомой в формате .gb вырезать три кодирующих последовательности по
указанным координатам "от", "до", "ориентация" и сохранить в одном fasta файле


Входные файлы: последовательность хромосомы, список последовательностей.
Команда bash : seqret @mylist.txt -outseq cleaves.fasta
Выходной файл cleaves.fasta.

Задание 4.Транслировать кодирующие последовательности, лежащие в одном fasta файле, в аминокислотные, используя
указанную таблицу генетического кода. Результат - в одном fasta файле.


Входные файлы с тремя последовательностями.
Команда bash : transeq -table 0 cleaves.fasta prot.fasta
Выходной файл prot.fasta

Задание 5.Транслировать данную нуклеотидную последовательность в шести рамках.


Входные файлы нуклеотидные последовательности.
Команда bash : transeq -frame 6 cleaves.fasta 6.fasta
Выходной файл 6.fasta

Задание 6. Перевести выравнивание и из fasta формате в формат .msf


Входные файлы выравнивание.
Команда bash :seqret ali.fasta -outseq msf::seq_ali.msf
Выходной файл выравнивание в другом формате

Задание 7. Выдать в выходной поток число совпадающих букв между второй последовательностью выравнивания и всеми остальными (на выходе только имя последовательности и число)


Входные файлы выравнивание.
Команда bash : infoalign alignment.fasta -outfile stdout -refseq 2 -only -name -idcount > n7.txt
Выходной файл - число совпадающих букв

Задание 8. (featcopy) Перевести аннотации особенностей в записи формата .gb в табличный формат .gff


Входные файлы запись формата .gb.
Команда bash : featcopy sequence.gb sequence.gff -offormat2 gff
Выходной файл chromosome.gff

Задание 10.Перемешать буквы в данной нуклеотидной последовательности.


Входные файлы нуклеотидная последовательность.
Команда bash : shuffleseq 478.fasta -outseq shuf.fasta
Выходной файл shuf.fasta

Задание 13. Найдите частоты кодонов в данных кодирующих последовательностях


Входные файлы нуклеотидная последовательность.
Команда bash : compseq ec.fasta -word 3 -outfile out.fasta
Выходной файл частота встречаемости кодонов

Задание 9. (extractfeat) Из данного файла с хромосомой в формате .gb получить fasta файл с кодирующими последовательностями; (*) добавить в описание каждой последовательности функцию белка (из поля product)


Входные файлы sequence.gb.
Команда bash : extractfeat sequence.gb -type CDS -describe product -outseq x7.fasta
Выходной файл x7.fasta

Задание 16. Постройте локальное множественное выравнивание трех нуклеотидных последовательностей


Входные файлы AAC74885.2.fasta ,AAC74885.2.fasta , ws2962.fasta , mylist10.txt ,
Команда bash : edialign @mylist10.txt -revcomp -outfile zz.fasta -outseq outt.fasta
Выходые файлы zz.fasta outt.fasta

Задание 19. Создайте три случайных нуклеотидных последовательностей длины сто


Команда bash : makenucseq -amount 3 -length 100 -outseq make.fasta
Выходной файл make.fasta

© Raldugina Vasilisa 2016