Практикум 9. EMBOSS 2.0

Задание 1

Данный скрипт имеет следующий синтаксис:


python3 pr9.py genome length attemptN

На выдачу он дает среднее число находок случайных последовательностей заданной длины с e-value меньше 0.1.


10

Файлы genome могут иметь разные форматы, в скрипт встроена штука, использующая seqret при необходимости. Также он сам чистит вспомогательные файлы. Скрипт лоскутный, долгий, но зато он работает и его было интересно писать. Разбираться, как это чудовище работает, будет не менее увлекательно, я думаю (особенно учитывая, что я не смогла приручить numpy).

P.S.

С работой Popen какой-то сюр. Программа (тот же бласт) требует в аргументы цифру (например, при выборе формы выдачи), прописывем int. Popen ругается, что он вообще-то хотел str. Ну ок, делаем строчку. Popen ругается, что программа ругается, ибо надо было цифру. ¯\_(ツ)_/¯ 

P.P.S.

На самом деле, большая часть элементов скрипта там изначально появилась, потому что было интересно повспоминать, как оно все работает, а потом уже было не до исправлений. In hope its better now

1

Рисунок 1. Базедова болезнь как стиль жизни.