EMBOSS + Python
Задача: найти частоты динуклеотидов в геноме бактерии, сравнить их с ожидаемыми и определить динуклеотид, частота которого наиболее отклоняется от наблюдаемой.
Исполнение: скачала себе файл с геномом E.Coli (AE014075.1) c сайта NCBI; написала скрипт на питоне с использованием модуля os, чтобы интегрировать команду из EMBOSS. Получающийся в промежутке файл выглядит так.
Команда запуска:
python3.6 pr9.py fasta::eco.fasta
Stdout после запуска:
Dinucleotide, which observed frequency deviates from its expected frequency the most, is GC .