EMBOSS

10 команд + скрипт

1. Создать три случайных нуклеотидных последовательностей длины 100.

makenucseq -auto -length 100 -amount 3 -outseq fasta:1.fasta

Входной файл:
Выход: 1.fasta

Один файл в формате fasta с несколькими последовательностями разделить на отдельные fasta файлы.

seqretsplit 1.fasta

Входной файл: 1.fasta
Выход: emboss_001.fasta; emboss_002.fasta; emboss_003.fasta

Несколько файлов в формате fasta собрать в единый файл.

seqret @fastas3.txt -outseq fasta:3.fasta

Входной файл: emboss_001.fasta; emboss_002.fasta; emboss_003.fasta;fastas3.txt
Выход: 3.fasta

Из данного файла с хромосомой в формате gb или embl получить fasta файл с кодирующими последовательностями.

extractfeat gb.gb -type CDS -describe product -outseq 4.fasta

Входной файл: gb.gb
Выход: 4.fasta

Перевести аннотации особенностей из файла формата gb или embl в табличный формат gff.

featcopy gb.gb -outfeat 5.gff

Входной файл:
Выход: 5.gff

Из файла с аннотированной хромосомой в формате gb вырезать три кодирующих последовательности.

seqret @cds6.txt -outseq 6.fasta

Входной файл:
Выход: 6.fasta

Транслировать (с первого кодона, то есть в первой рамке) кодирующие последовательности.

transeq 6.fasta -frame 1 -table 0 -outseq 7.fasta

Входной файл: 6.fasta
Выход: 7.fasta

Перевести выравнивание из формата fasta в формат msf.

seqret al8.fasta -outseq msf:al8.msf

Входной файл: al8.fasta
Выход: al8.msf

Удалить символы гэпов из выравнивания.

degapseq al8.fasta -outseq 9.fasta

Входной файл: al8.fasta
Выход: 9.fasta

Перемешать буквы в данной нуклеотидной последовательности.

shuffleseq al1.fasta -outseq 10.fasta

Входной файл: al1.fasta
Выход: 10.fasta

По данному аннотированному файлу в формате gb (из GenBank или RefSeq) или embl (из ENA) создать файл с кодирующими последовательностями в формате fasta, добавив в описание каждой последовательности функцию белка (из поля product).

python py.py gb.gb py.fasta

Входной файл: gb.gb; py.py
Выход: py.fasta

Полезные ссылки:

Главная страница;

Профайл;

Учебные реалии, или список семестров;

Официальный сайт ФББ МГУ.

EMBOSS

10 команд + скрипт

1. Создать три случайных нуклеотидных последовательностей длины 100.

makenucseq -auto -length 100 -amount 3 -outseq fasta:1.fasta

Входной файл:
Выход: 1.fasta

Один файл в формате fasta с несколькими последовательностями разделить на отдельные fasta файлы.

seqretsplit 1.fasta

Входной файл: 1.fasta
Выход: emboss_001.fasta; emboss_002.fasta; emboss_003.fasta

Несколько файлов в формате fasta собрать в единый файл.

seqret @fastas3.txt -outseq fasta:3.fasta

Входной файл: emboss_001.fasta; emboss_002.fasta; emboss_003.fasta;fastas3.txt
Выход: 3.fasta

Из данного файла с хромосомой в формате gb или embl получить fasta файл с кодирующими последовательностями.

extractfeat gb.gb -type CDS -describe product -outseq 4.fasta

Входной файл: gb.gb
Выход: 4.fasta

Перевести аннотации особенностей из файла формата gb или embl в табличный формат gff.

featcopy gb.gb -outfeat 5.gff

Входной файл:
Выход: 5.gff

Из файла с аннотированной хромосомой в формате gb вырезать три кодирующих последовательности.

seqret @cds6.txt -outseq 6.fasta

Входной файл:
Выход: 6.fasta

Транслировать (с первого кодона, то есть в первой рамке) кодирующие последовательности.

transeq 6.fasta -frame 1 -table 0 -outseq 7.fasta

Входной файл: 6.fasta
Выход: 7.fasta

Перевести выравнивание из формата fasta в формат msf.

seqret al8.fasta -outseq msf:al8.msf

Входной файл: al8.fasta
Выход: al8.msf

Удалить символы гэпов из выравнивания.

degapseq al8.fasta -outseq 9.fasta

Входной файл: al8.fasta
Выход: 9.fasta

Перемешать буквы в данной нуклеотидной последовательности.

shuffleseq al1.fasta -outseq 10.fasta

Входной файл: al1.fasta
Выход: 10.fasta

Входной файл: gb.gb; py.py
Выход: py.fasta

Полезные ссылки:

EMBOSS

10 команд + скрипт

1. Создать три случайных нуклеотидных последовательностей длины 100. makenucseq -auto -length 100 -amount 3 -outseq fasta:1.fasta

Входной файл: Выход: 1.fasta

Один файл в формате fasta с несколькими последовательностями разделить на отдельные fasta файлы. seqretsplit 1.fasta

Входной файл: 1.fasta Выход: emboss_001.fasta; emboss_002.fasta; emboss_003.fasta

Несколько файлов в формате fasta собрать в единый файл. seqret @fastas3.txt -outseq fasta:3.fasta

Входной файл: emboss_001.fasta; emboss_002.fasta; emboss_003.fasta;fastas3.txt Выход: 3.fasta

Из данного файла с хромосомой в формате gb или embl получить fasta файл с кодирующими последовательностями. extractfeat gb.gb -type CDS -describe product -outseq 4.fasta

Входной файл: gb.gb Выход: 4.fasta

Перевести аннотации особенностей из файла формата gb или embl в табличный формат gff. featcopy gb.gb -outfeat 5.gff

Входной файл: Выход: 5.gff

Из файла с аннотированной хромосомой в формате gb вырезать три кодирующих последовательности. seqret @cds6.txt -outseq 6.fasta

Входной файл: Выход: 6.fasta

Транслировать (с первого кодона, то есть в первой рамке) кодирующие последовательности. transeq 6.fasta -frame 1 -table 0 -outseq 7.fasta

Входной файл: 6.fasta Выход: 7.fasta

Перевести выравнивание из формата fasta в формат msf. seqret al8.fasta -outseq msf:al8.msf

Входной файл: al8.fasta Выход: al8.msf

Удалить символы гэпов из выравнивания. degapseq al8.fasta -outseq 9.fasta

Входной файл: al8.fasta Выход: 9.fasta

Перемешать буквы в данной нуклеотидной последовательности. shuffleseq al1.fasta -outseq 10.fasta

Входной файл: al1.fasta Выход: 10.fasta

Входной файл: gb.gb; py.py Выход: py.fasta

Полезные ссылки:

1. Создать три случайных нуклеотидных последовательностей длины 100.

makenucseq -auto -length 100 -amount 3 -outseq fasta:1.fasta

Входной файл:
Выход: 1.fasta

Один файл в формате fasta с несколькими последовательностями разделить на отдельные fasta файлы.

seqretsplit 1.fasta

Входной файл: 1.fasta
Выход: emboss_001.fasta; emboss_002.fasta; emboss_003.fasta

Несколько файлов в формате fasta собрать в единый файл.

seqret @fastas3.txt -outseq fasta:3.fasta

Входной файл: emboss_001.fasta; emboss_002.fasta; emboss_003.fasta;fastas3.txt
Выход: 3.fasta

Из данного файла с хромосомой в формате gb или embl получить fasta файл с кодирующими последовательностями.

extractfeat gb.gb -type CDS -describe product -outseq 4.fasta

Входной файл: gb.gb
Выход: 4.fasta

Перевести аннотации особенностей из файла формата gb или embl в табличный формат gff.

featcopy gb.gb -outfeat 5.gff

Входной файл:
Выход: 5.gff

Из файла с аннотированной хромосомой в формате gb вырезать три кодирующих последовательности.

seqret @cds6.txt -outseq 6.fasta

Входной файл:
Выход: 6.fasta

Транслировать (с первого кодона, то есть в первой рамке) кодирующие последовательности.

transeq 6.fasta -frame 1 -table 0 -outseq 7.fasta

Входной файл: 6.fasta
Выход: 7.fasta

Перевести выравнивание из формата fasta в формат msf.

seqret al8.fasta -outseq msf:al8.msf

Входной файл: al8.fasta
Выход: al8.msf

Удалить символы гэпов из выравнивания.

degapseq al8.fasta -outseq 9.fasta

Входной файл: al8.fasta
Выход: 9.fasta

Перемешать буквы в данной нуклеотидной последовательности.

shuffleseq al1.fasta -outseq 10.fasta

Входной файл: al1.fasta
Выход: 10.fasta

Входной файл: gb.gb; py.py
Выход: py.fasta