Практикум 9. EMBOSS
Task 1
EMBOSS - биоинформатический пакет программ. Он очень полезен для разных задач. В качестве задания для практикума было предложено написать программу, выполняющую одну из практических задач.
Написанная нами программа принимает на вход файл с последовательностями в формате fasta, создает файл в формате compseq с частотами встречаемости динуклеотидов и выводит в терминале динуклеотид, частота встречаемости которого более всего отличается от ожидаемой (вместе с динуклеотидом выводится |lg(ожид.частота/набл.частота)|).
Программа severyanin_genius.sh создает файл в формате compseq и запускает выполнение скрипта на Python3 whaat.py. Скрипт читает файл compseq и считает для каждого динуклеотида модуль логарифма, запоминая наибольший, и печатает вывод в командной строке.
Скрипт PythonИсполняемая программа
Строка для исполнения:
./severyanin_genius.sh way/to/file.fasta
Пример вывода:
GG 0.7221525772737097 (logarithm module of exp_fr/obs_fr)