EMBOSS.Локальный Blast

Отчет о выполнении десяти упражнений

№	Ссылка на исходные данные	Командная строка	Ссылка на результат
1	Файл 1 Файл 2 Файл 3 Файл 4	seqret '*.fasta' -outseq big.fasta	Результат
2	Исходные данные	seqretsplit seqdump.txt -auto	Файл 1 Файл 2 Файл 3 Файл 4
3	Исходные данные Участки CDS	seqret list::parts.txt -outseq np.fasta	Результат
4	Исходные данные	transeq KT313400.fasta -frame 1 -table 0 -outseq res.aa	Результат
6	Исходные данные	featcopy gral.gb -outfeat table.gff	Результат
9	Исходные данные	extractfeat gral.gb -type CDS -outseq cds.fasta	Результат
11		makenucseq -auto -amount 3 -length 100 random.fasta	Результат
12	Исходные данные	wordcount cds.fasta -wordsize 1 -outfile freq.txt	Результат
13	Файл 1 Файл 2	tranalign nuc.fasta nuc-h3.fasta -outseq nuch3.fasta	Результат
14	Исходные данные	degapseq nuc-h3.fasta newnuc.fasta	Результат

Задание 2. Скрипт

Была выбрана задача: По данному аннотированному файлу в формате gb (из GenBank или RefSeq) или embl (из ENA) создать файл с кодирующими последовательностями в формате fasta, добавив в описание каждой последовательности функцию белка (из поля product).
Для ее решения был написан скрипт на bash.

Описания использования:
Ввод в командную строку

./script.sh 'name'

Где 'name' - это имя файла в формате gb (из GenBank или RefSeq) или embl (из ENA), лежащего в рабочей директории или, если файл не скачан, то ссылка на запись в банке в формате USA, без указания координат. (X::Y:Z)

Формат USA имеет вид: X::Y:Z[a:b:r], где X - формат входного файла, Y - имя базы данных или файла, Z - имя последовательности. a и b cоответственно начало и конец исследуемого участка, r - обозначение прямой брать участок или обратный.