EMBOSS
EMBOSS
10 команд + скрипт
1. Создать три случайных нуклеотидных последовательностей длины 100.
makenucseq -auto -length 100 -amount 3 -outseq fasta:1.fasta
Входной файл:
Выход: 1.fasta
Один файл в формате fasta с несколькими последовательностями разделить на отдельные fasta файлы.
seqretsplit 1.fasta
Несколько файлов в формате fasta собрать в единый файл.
seqret @fastas3.txt -outseq fasta:3.fasta
Из данного файла с хромосомой в формате gb или embl получить fasta файл с кодирующими последовательностями.
extractfeat gb.gb -type CDS -describe product -outseq 4.fasta
Перевести аннотации особенностей из файла формата gb или embl в табличный формат gff.
featcopy gb.gb -outfeat 5.gff
Входной файл:
Выход: 5.gff
Из файла с аннотированной хромосомой в формате gb вырезать три кодирующих последовательности.
seqret @cds6.txt -outseq 6.fasta
Входной файл:
Выход: 6.fasta
Транслировать (с первого кодона, то есть в первой рамке) кодирующие последовательности.
transeq 6.fasta -frame 1 -table 0 -outseq 7.fasta
Перевести выравнивание из формата fasta в формат msf.
seqret al8.fasta -outseq msf:al8.msf
Удалить символы гэпов из выравнивания.
degapseq al8.fasta -outseq 9.fasta
Перемешать буквы в данной нуклеотидной последовательности.
shuffleseq al1.fasta -outseq 10.fasta
По данному аннотированному файлу в формате gb (из GenBank или RefSeq) или embl (из ENA) создать файл с кодирующими последовательностями в формате fasta, добавив в описание каждой последовательности функцию белка (из поля product).
python py.py gb.gb py.fasta
Полезные ссылки:
Главная страница;
Профайл;
Учебные реалии, или список семестров;
Официальный сайт ФББ МГУ.
© Daniel Igumnov, 2018