EMBOSS.Локальный Blast

Отчет о выполнении десяти упражнений

Ссылка на исходные данные Командная строка Ссылка на результат
1 Файл 1 Файл 2 Файл 3 Файл 4
 seqret '*.fasta'  -outseq big.fasta
Результат
2 Исходные данные
 seqretsplit seqdump.txt -auto
Файл 1 Файл 2 Файл 3 Файл 4
3 Исходные данные Участки CDS
seqret list::parts.txt -outseq np.fasta
Результат
4 Исходные данные
 transeq KT313400.fasta -frame 1 -table 0 -outseq res.aa
Результат
6 Исходные данные
featcopy gral.gb -outfeat table.gff
Результат
9 Исходные данные
extractfeat gral.gb -type CDS -outseq cds.fasta
Результат
11
makenucseq  -auto -amount 3 -length 100 random.fasta
Результат
12 Исходные данные
wordcount cds.fasta -wordsize 1 -outfile freq.txt
Результат
13 Файл 1 Файл 2
tranalign nuc.fasta nuc-h3.fasta -outseq nuch3.fasta
Результат
14 Исходные данные
degapseq nuc-h3.fasta newnuc.fasta
Результат

Задание 2. Скрипт

Была выбрана задача: По данному аннотированному файлу в формате gb (из GenBank или RefSeq) или embl (из ENA) создать файл с кодирующими последовательностями в формате fasta, добавив в описание каждой последовательности функцию белка (из поля product).
Для ее решения был написан скрипт на bash.
Описания использования:
Ввод в командную строку
./script.sh 'name' 


Где 'name' - это имя файла в формате gb (из GenBank или RefSeq) или embl (из ENA), лежащего в рабочей директории или, если файл не скачан, то ссылка на запись в банке в формате USA, без указания координат. (X::Y:Z)

Формат USA имеет вид: X::Y:Z[a:b:r], где X - формат входного файла, Y - имя базы данных или файла, Z - имя последовательности. a и b cоответственно начало и конец исследуемого участка, r - обозначение прямой брать участок или обратный.

© Нестеренко Екатерина 2018