О себе |
I семестр |
II семестр |
Сайт ФББ
Примеры команд EMBOSS
1. Несколько файлов в формате fasta собрать в единый файл.
seqret @t01_list.txt t01_seqs_from_list.fasta
Исходные файлы:
Последовательность 1
Последовательность 2
Последовательность 3
Выдача команды:
Результат
2.Один файл в формате fasta с несколькими последовательностями разделить на
отдельные fasta файлы.
seqretsplit t02_i.fasta -auto
Исходные файлы:
Файл с тремя последовательностями
Выдача команды:
Последовательность 1
Последовательность 2
Последовательность 3
4. Транслировать (с первого кодона, то есть в первой рамке) кодирующие
последовательности, лежащие в одном fasta файле, в аминокислотные, используя
указанную таблицу генетического кода, и положить результат в один fasta файл.
transeq t04_seqs.fasta -frame 1 -table 0 t04_trans_seqs.fasta
Исходный файл:
Нуклеиновые кислоты
Выдача команды:
Аминокислотные последовательности
5. Вывести открытые рамки длиной не менее заданной, имеющиеся в
данной нуклеотидной последовательности.
getorf t05_seq1.fasta -minsize 30 t05_s1_open_frames.fasta
Исходные файлы:
Исходный файл
Выдача команды:
Результат
8. Перевести аннотации особенностей из файла формата gb или embl
в табличный формат gff.
featcopy t8_chr.gb t8_chr.gff
Исходные файлы:
Хромосома 3 Saccharomyces cerevisiae в формате gb
Выдача команды:
Таблица особенностей в формате gff
9. Из данного файла с хромосомой в формате gb или embl
получить fasta файл с кодирующими последовательностями.
extractfeat -type CDS t08_chr.gb t09_chr_cds.fasta
Исходные файлы:
Хромосома
Выдача команды:
fasta файл с кодирующими последовательностями
этой хромосомы
10. Перемешать буквы в данной нуклеотидной последовательности.
shuffleseq t10_i.fasta t10_sh.fasta
Исходные файлы:
Исходная последовательность
Выдача команды:
Результат
11. Создать три случайных нуклеотидных последовательностей длины 100.
makenucseq -amount 3 -length 100
Выдача команды:
Результат
12. Найти частоты кодонов в данных кодирующих последовательностях.
cusp t12_i.fasta t12_ult.cusp
Исходные файлы:
Исходный файл
Выдача команды:
Файл с частотами кодонов
15. Перевести символы конца строки из формата Windows в формат Unix.
noreturn -system unix t15_win.txt t15_u.txt
Исходные файлы:
Windows
Выдача команды:
Unix
Задание 2 (задача 4)
Python скрипт
Скрипт по аннотированному файлу в формате gb
(из GenBank или RefSeq) или embl (из ENA), название которого вводится в командной строке,
создает файл с кодирующими последовательностями в формате fasta,
добавив в описание каждой последовательности функцию белка из поля product.
© Антоненкова Юлия, 2017