Замечание. Если подходящих, по вашему мнению, программ несколько,
протестируйте их на своей последовательности и выберите ту, которая
представляет результат в наиболее удобной форме. В частности, желательно,
чтобы в описании каждого ORF'а
приводились его координаты в исходной последовательности.
Как подать на вход blastall произвольный ORF из файла? Это было бы легко, если бы blastall понимал USA, но это не так (blastall, к сожалению, не часть EMBOSS'а). Поэтому придется сначала создать вход для blastall программой seqret.
Программа blastall берет пробную последовательность из stdin, если опустить параметр -i. Программе же seqret можно приказать выдавать результат на stdout, просто написав вместо имени выходного файла "stdout". Тем самым, двойной конвейер seqret → blastall → grep (правильно написанный, разумеется) решает задачу.
В принципе, скрипт из таких конвейеров можно создать "руками"
(Copy-Paste + правка имен последовательностей), поскольку
ORF'ов не так много. Рекомендуется, однако, потренироваться в создании такого
рода скриптов в Excel. Создайте новую книгу и перенесите в нее столбец
список имен ORF'ов.
Внесите в ячейки левее и правее первого имени нужный текст (например, левее будет
что-то вроде
chmod +x my.script ./my.script(естественно, вместо "my.script" надо поставить имя вашего файла). Убедившись, что все работает правильно, надо перенаправить вывод (stdout) скрипта в файл, который затем импортировать в Excel. Дальнейшее не должно вызвать затруднений.