1.-2) Один файл в формате fasta с несколькими последовательностями разделить на отдельные fasta файлы
-исходные данные: ссылка
-команды с параметрами:

marinanenart@kodomo:~/term3/block2/pr9$ seqretsplit
Read sequences and write them to individual files
Input (gapped) sequence(s): 2_X5.fasta
output sequence(s) [scaffold-9.fasta]:

-результат: ccылки: 1), 2), 3), 4)


2.-9) (extractfeat) Из данного файла с хромосомой в формате gb или embl получить fasta файл с кодирующими последовательностями
-исходные данные: ссылка
-команды с параметрами:
marinanenart@kodomo:~/term3/block2/pr9$ extractfeat
Extract features from sequence(s)
Input sequence(s): chrom_1.fasta
output sequence [nc_000001.fasta]: chrom_nc.fasta

-результат: ссылка


3.-10) Перемешать буквы в данной нуклеотидной последовательности
-исходные данные: ссылка
-команды с параметрами:
marinanenart@kodomo:~/term3/block2/pr9$ shuffleseq
Shuffle a set of sequences maintaining composition
Input sequence(s): chrom_nc.fasta.fasta
output sequence(s) [scaffold-9.fasta]: chrom_r.fasta.fasta

-результат: ссылка

4.- 11) Создать три случайных нуклеотидных последовательностей длины 100
-команды с параметрами:
marinanenart@kodomo:~/term3/block2/pr9$ makenucseq
Create random nucleotide sequences
Codon usage file (optional):
Number of sequences created [100]: 3
Length of each sequence [100]:
nucleotide output sequence(s) [makeseq.fasta]: AT.fasta

- Результат: ccылка


5.- 12) Найти частоты кодонов в данных кодирующих последовательностях
-исходные данные: ссылка
-команды с параметрами:
marinanenart@kodomo:~/term3/block2/pr9$ cusp
Create a codon usage table from nucleotide sequence(s)
Input nucleotide sequence(s): AT.fasta
Output file [emboss_001.cusp]: AT_count.fasta

-результат: ссылка


6.- 5) Вывести открытые рамки длиной не менее заданной, имеющиеся в данной нуклеотидной последовательности
-исходные данные: ссылка
-команды с параметрами:
marinanenart@kodomo:~/term3/block2/pr9$ getorf
Find and extract open reading frames (ORFs)
Input nucleotide sequence(s): 2_X5.fasta
protein output sequence(s) [scaffold-9.orf]: prot.fasta

-результат: ссылка

7.- 4) Транслировать (с первого кодона, то есть в первой рамке) кодирующие последовательности, лежащие в одном fasta файле, в аминокислотные, используя указанную таблицу генетического кода, и положить результат в один fasta файл.
-исходные данные: ссылка
-команды с параметрами:
marinanenart@kodomo:~/term3/block2/pr9$ transeq -frame 1
Translate nucleic acid sequences
Input nucleotide sequence(s): 2_X5.fasta
protein output sequence(s) [scaffold-9.pep]: tran_prot.fasta

-результат: ссылка

8.-8) (featcopy) Перевести аннотации особенностей из файла формата gb или embl в табличный формат gff
-исходные данные:ссылка
-команды с параметрами:
marinanenart@kodomo:~/term3/block2/pr9$ featcopy
Read and write a feature table
Input feature table: p53.gb
Features output [p53.gff]:

-результат:ссылка

9.- 1) Несколько файлов в формате fasta собрать в единый файл
-исходные данные: ссылки-
1)
2)
3)
-команды с параметрами:
marinanenart@kodomo:~/term3/block2/pr9/task9$ seqret
Read and write (return) sequences
Input (gapped) sequence(s): emboss_*.fasta
output sequence(s) [emboss_001.fasta]: em.fasta

-результат: ссылка

10.- 3) Из файла с хромосомой в формате .gb вырезать три кодирующих последовательности по указанным координатам "от", "до", "ориентация" и сохранить в одном fasta файле
- исходные данные: ссылка ,
файл txt
-команды с параметрами: seqret @mylist2.txt -outseq num3.fasta -результат: файл

Задание 2- 1) Проверить, сколько находок с E-value < 0.1 в среднем находит blastn для случайной последовательности данной длины в данном геноме бактерии
*ссылка на код
Cравнеие происходило по геному бактерии E.Coli штамм K12 (АС- NC_000913.3). По результатам выдачи оказалось 10 находок на 100 итераций. (ссылка на таблицу с результатом)


© Nenartovich Marina 2017