Практикум 9. EMBOSS

Task 1

EMBOSS - биоинформатический пакет программ. Он очень полезен для разных задач. В качестве задания для практикума было предложено написать программу, выполняющую одну из практических задач.

Написанная нами программа принимает на вход файл с последовательностями в формате fasta, создает файл в формате compseq с частотами встречаемости динуклеотидов и выводит в терминале динуклеотид, частота встречаемости которого более всего отличается от ожидаемой (вместе с динуклеотидом выводится |lg(ожид.частота/набл.частота)|).

Программа severyanin_genius.sh создает файл в формате compseq и запускает выполнение скрипта на Python3 whaat.py. Скрипт читает файл compseq и считает для каждого динуклеотида модуль логарифма, запоминая наибольший, и печатает вывод в командной строке.

Скрипт PythonИсполняемая программа

Строка для исполнения:

 ./severyanin_genius.sh way/to/file.fasta

Пример вывода:

GG  0.7221525772737097 (logarithm module of exp_fr/obs_fr)

НАЗАД