EMBOSS и локальный BLAST

Упражнение 1.

1. Несколько файлов в формате fasta в единый файл.

Входные файлы:

1.fasta,2.fasta,3.fasta находились в директории seq_fasta

Команда с параметрами:
seqret "seq_fasta/*" sum.fasta

Результат:

sum.fasta

2. Один файл в fasta формате разделить на отдельные fasta файлы.

Входные файлы:

sum.fasta

Команда с параметрами:
seqretsplit sum.fasta -osdirectory2 seq_fasta2

Результат:

nc_012492.fasta, nc_013266.fasta, sequence_name.fasta

3. Из файла с аннотированной хромосомой в формате gb вырезать три кодирующих последовательности по указанным координатам в отдельный fasta файл.

Входные файлы:sequence.gb

list.txt

Команда с параметрами:
seqret @list.txt -outseq out_3.fasta

Результат:out_3.fasta

4. Транслировать кодирующие последовательности в аминокислотные, используя указанную таблицу генетического кода.

Входные файлы:

out_3.fasta

Команда с параметрами:

transeq -table 0 out_3.fasta prot_3.fasta

Результат:

prot_3.fasta

5. Вывести открытые рамки длиной не менее заданной, имеющиеся в данной нуклеотидной последовательности.

Входные файлы:

out_3.fasta

Команда с параметрами:

getorf out_3.fasta -minsize 10

Результат:

cp014327.orf

6. Перевести выравнивание из формата fasta в формат msf

Входные файлы:

n4.fasta

Команда с параметрами:

aligncopy n4.fasta -aformat msf

Output alignment [n4.aligncopy]: n4.msf

Результат:

n4.msf

7. Число совпадающих букв между второй последовательностью выравнивания и всеми остальными.

Входные файлы:

lastpr_alignment.fasta

Команда с параметрами:

infoalign lastpr_alignment.fasta -refseq 2 -outfile stdout -only -name -idcount > n7.txt

Результат:

n7.txt

8. Перевести аннотации особенностей из файла формата gb или embl в табличный формат gff.

Входные файлы:

sequence.gb

Команда с параметрами:

featcopy sequence.gb sequence.gff

Результат:

sequence.gff

9. Из данного файла с хромосомой в формате gb или embl получить fasta файл с кодирующими последовательностями.

Входные файлы:

sequence.gb

Команда с параметрами:

extractfeat sequence.gb -type cds

Результат:

cp014327.fasta

10. Перемешать буквы в данной нуклеотидной последовательности.

Входные файлы:

1.fasta

Команда с параметрами:

shuffleseq 1.fasta -outseq shuffle.fasta

Результат:

shuffle.fasta

11. Создать три случайных нуклеотидных последовательностей длины 100.

Команда с параметрами:

makenucseq -length 100 -amount 3

Результат:

makeseq.fasta

12. Найти частоты кодонов в данных кодирующих последовательностях.

Входные файлы:

sequence.gb

Команда с параметрами:

cusp sequence.gb

Результат:

cp014327.cusp

Упражнение 2.

Задание 4.

Входные файлы:

sequence.gb

Ссылка на скрипт:

pr9.sh

Результат:

out_seq.fasta

© Simon Konnov 2018