Предсказание генов прокариот.

         Для выполнения данного задания мне была дана плазмида Frondihabitans sp. PAMC 28766.
         Таксономия: Bacteria; Actinobacteria; Micrococcales; Microbacteriaceae; Frondihabitans.
         Аэробные бактерии (штамм E1HC-02(T)), был выделен из разлагающихся опавших листьев тропического леса на юго-востоке 
         штата Квинсленд на северо-востоке материковой части Австралии.Клетки штамма E1HC-02 (Т) - короткие палочки (0,5-1,0 х 0,2-0,4 Microm), 
         которые окрашивали грамположительные и обладавшие клеточной стенкой ультраструктуры которые, были изготовлены из белковых субъединиц.
                  
Сначала с помощью команд:
                 seqret embl:CP015748 fasta::cp014516.fasta 
                 seqret embl:CP015748 gff::cp014516.gff -feature 
была скачана последовательность выданной мне плазмиды в двух форматах: cp014516.fasta и cp014516.gff. При этом в итоговом файле .gff были сохранены особенности (features) с помощью квалификатора -features, т.к. они понадобятся для дальнейшей работы.

Затем с помощью Prodigal были предсказаны гены в данной плазмиде.
  prodigal.exe -i cp015748.fasta -o prodigal.fasta -f sco 
При этом был выбран (-f sco) минималистичный формат sco для записи результата: prodigal.fasta.

Из обоих файлов координаты генов (начало, конец, ориентация, разделенные символом '_') были записаны в отдельные файлы с помощью команд:
                    grep CDS cp015748.gff | cut -f 4,5,7 --output-delimiter='_'> genbank.out
                    grep '>' prodigal.fasta | cut -f 2,3,4 -d '_'  > prodigal.out 
Полученные файлы с координатами: prodigal.out, genbank.out.

Затем я создала скрипт pr11.py, с помощью которого были оценены следующие показатели: