О себе | I семестр | II семестр | Сайт ФББ



Примеры команд EMBOSS

1. Несколько файлов в формате fasta собрать в единый файл.

seqret @t01_list.txt t01_seqs_from_list.fasta
Исходные файлы:
Последовательность 1
Последовательность 2
Последовательность 3
Выдача команды:
Результат


2.Один файл в формате fasta с несколькими последовательностями разделить на отдельные fasta файлы.
seqretsplit t02_i.fasta -auto
Исходные файлы:
Файл с тремя последовательностями
Выдача команды:
Последовательность 1
Последовательность 2
Последовательность 3


4. Транслировать (с первого кодона, то есть в первой рамке) кодирующие последовательности, лежащие в одном fasta файле, в аминокислотные, используя указанную таблицу генетического кода, и положить результат в один fasta файл.
transeq t04_seqs.fasta -frame 1 -table 0 t04_trans_seqs.fasta
Исходный файл:
Нуклеиновые кислоты
Выдача команды:
Аминокислотные последовательности


5. Вывести открытые рамки длиной не менее заданной, имеющиеся в данной нуклеотидной последовательности.
getorf t05_seq1.fasta -minsize 30 t05_s1_open_frames.fasta
Исходные файлы:
Исходный файл
Выдача команды:
Результат


8. Перевести аннотации особенностей из файла формата gb или embl в табличный формат gff.
                          
featcopy t8_chr.gb t8_chr.gff                               
Исходные файлы:
Хромосома 3 Saccharomyces cerevisiae в формате gb
Выдача команды:
Таблица особенностей в формате gff


9. Из данного файла с хромосомой в формате gb или embl получить fasta файл с кодирующими последовательностями.
extractfeat -type CDS t08_chr.gb t09_chr_cds.fasta
Исходные файлы:
Хромосома
Выдача команды:
fasta файл с кодирующими последовательностями этой хромосомы


10. Перемешать буквы в данной нуклеотидной последовательности.
shuffleseq t10_i.fasta t10_sh.fasta
Исходные файлы:
Исходная последовательность
Выдача команды:
Результат


11. Создать три случайных нуклеотидных последовательностей длины 100.
makenucseq -amount 3 -length 100
Выдача команды:
Результат


12. Найти частоты кодонов в данных кодирующих последовательностях.
cusp t12_i.fasta t12_ult.cusp
Исходные файлы:
Исходный файл
Выдача команды:
Файл с частотами кодонов


15. Перевести символы конца строки из формата Windows в формат Unix.
noreturn -system unix t15_win.txt t15_u.txt
Исходные файлы:
Windows
Выдача команды:
Unix




Задание 2 (задача 4)


Python скрипт

Скрипт по аннотированному файлу в формате gb (из GenBank или RefSeq) или embl (из ENA), название которого вводится в командной строке, создает файл с кодирующими последовательностями в формате fasta, добавив в описание каждой последовательности функцию белка из поля product.






© Антоненкова Юлия, 2017