Практикум 9. EMBOSS 2.0
Задание 1
Данный скрипт имеет следующий синтаксис:
python3 pr9.py genome length attemptN
На выдачу он дает среднее число находок случайных последовательностей заданной длины с e-value меньше 0.1.
10
Файлы genome могут иметь разные форматы, в скрипт встроена штука, использующая seqret при необходимости. Также он сам чистит вспомогательные файлы. Скрипт лоскутный, долгий, но зато он работает и его было интересно писать. Разбираться, как это чудовище работает, будет не менее увлекательно, я думаю (особенно учитывая, что я не смогла приручить numpy).
P.S.
С работой Popen какой-то сюр. Программа (тот же бласт) требует в аргументы цифру (например, при выборе формы выдачи), прописывем int. Popen ругается, что он вообще-то хотел str. Ну ок, делаем строчку. Popen ругается, что программа ругается, ибо надо было цифру. ¯\_(ツ)_/¯
P.P.S.
На самом деле, большая часть элементов скрипта там изначально появилась, потому что было интересно повспоминать, как оно все работает, а потом уже было не до исправлений. In hope its better now