EMBOSS и локальный BLAST
Упражнение 1.
1. Несколько файлов в формате fasta в единый файл.
Входные файлы:
1.fasta,2.fasta,3.fasta находились в директории seq_fasta
Команда с параметрами:seqret "seq_fasta/*" sum.fasta
Результат:
sum.fasta
2. Один файл в fasta формате разделить на отдельные fasta файлы.
Входные файлы:
sum.fasta
Команда с параметрами: seqretsplit sum.fasta -osdirectory2 seq_fasta2
Результат:
nc_012492.fasta, nc_013266.fasta, sequence_name.fasta
3. Из файла с аннотированной хромосомой в формате gb вырезать три кодирующих последовательности по указанным координатам в отдельный fasta файл.
list.txt
Команда с параметрами:seqret @list.txt -outseq out_3.fasta
4. Транслировать кодирующие последовательности в аминокислотные, используя указанную таблицу генетического кода.
Входные файлы:
out_3.fasta
Команда с параметрами:
transeq -table 0 out_3.fasta prot_3.fasta
Результат:
prot_3.fasta
5. Вывести открытые рамки длиной не менее заданной, имеющиеся в данной нуклеотидной последовательности.
Входные файлы:
out_3.fasta
Команда с параметрами:
getorf out_3.fasta -minsize 10
Результат:
cp014327.orf
6. Перевести выравнивание из формата fasta в формат msf
Входные файлы:
n4.fasta
Команда с параметрами:
aligncopy n4.fasta -aformat msf
Output alignment [n4.aligncopy]: n4.msf
Результат:
n4.msf
7. Число совпадающих букв между второй последовательностью выравнивания и всеми остальными.
Входные файлы:
lastpr_alignment.fasta
Команда с параметрами:
infoalign lastpr_alignment.fasta -refseq 2 -outfile stdout -only -name -idcount > n7.txt
Результат:
n7.txt
8. Перевести аннотации особенностей из файла формата gb или embl в табличный формат gff.
Входные файлы:
sequence.gb
Команда с параметрами:
featcopy sequence.gb sequence.gff
Результат:
sequence.gff
9. Из данного файла с хромосомой в формате gb или embl получить fasta файл с кодирующими последовательностями.
Входные файлы:
sequence.gb
Команда с параметрами:
extractfeat sequence.gb -type cds
Результат:
cp014327.fasta
10. Перемешать буквы в данной нуклеотидной последовательности.
Входные файлы:
1.fasta
Команда с параметрами:
shuffleseq 1.fasta -outseq shuffle.fasta
Результат:
shuffle.fasta
11. Создать три случайных нуклеотидных последовательностей длины 100.
Команда с параметрами:
makenucseq -length 100 -amount 3
Результат:
makeseq.fasta
12. Найти частоты кодонов в данных кодирующих последовательностях.
Входные файлы:
sequence.gb
Команда с параметрами:
cusp sequence.gb
Результат:
cp014327.cusp
Упражнение 2.
Задание 4.
Входные файлы:
sequence.gb
Ссылка на скрипт:
pr9.sh
Результат:
out_seq.fasta
© Simon Konnov 2018