fasta35 query.fasta db.fasta 6где query.fasta — файл с пробной последовательностью, db.fasta — файл с банком последовательностей, 6 — параметр (для нуклеотидных последовательностей вместо 6 можно ставить 3, 4 или 5; для белковых последовательностей вместо 6 необходимо ставить 1 или 2).
Программа fasta задумана как интерактивная. Это значит, что в процессе работы она задаёт вопросы и ждёт от пользователя ответов. Чтобы запускать такую программу из скрипта, надо заранее продумать ответы на все вопросы, записать ответы в файл (по строке на ответ) и подать этот файл программе в качестве stdin (это можно сделать двумя способами: конвейером из программы cat и посредством знака <; последний в командной строке надо ставить после самой команды).
Интересно не столько общее число находок, сколько число находок с достаточно низким E-value. К сожалению, последняя версия программы fasta почему-то не понимает порога на E-value, который, по идее, должно быть возможно прописать в командной строке... Значит, надо придумать такую комбинацию grep и средств Excel, которая всё же позволила бы достаточно быстро получить нужные числа.
Стоит добавить, что fasta под Windows и Linux доступна с адреса http://fasta.bioch.virginia.edu/fasta_www2/fasta_down.shtml