Программа | Пробная посл-ть |
Где ищет (тип данных банка) | Для чего служит | Примечание |
BLASTN | НК | НК |
|
Непригодна для поиска сколько-нибудь удаленных гомологов |
BLASTP | Белок | Белки | Поиск гомологов | |
BLASTX | НК | Белки | Эта программа часто используется на первом этапе анализа новых нуклеотидных последовательностей для предсказания кодирующих участков | Проба транслируется в 6 рамках |
TBLASTN | Белок | НК | Поиск гомологов белка в неаннотированных нуклеотидных последовательностях | Банк транслируется в 6 рамках |
TBLASTX | НК | НК | Поиск гомологов к кодирующим участкам. Полезна, если в пробной последовательности много ошибок. | 6x6=36. Работает долго. Применяется редко. |
Про программы пакета BLAST и их установку на своем компьютере читайте здесь.
Зайдите на kodomo-count, перейдите в свою рабочую директорию и вызовите подсказку к программе formatdb, набрав
formatdb -(если подсказка не умещается в окне, организуйте конвейер к программе more, внутри программы more пользуйтесь клавишами "пробел" и "Enter". Другой вариант перенаправить выдачу в файл, пользуясь спецсимволом ">").
Вам понадобятся опции -i, -p и -n, остальные не нужны. Изучите их смысл и придайте им правильные значения. Программа formatdb создает в текущей директории три файла с расширениями nhr, nin и nsq; первая часть имен этих трех файлов одинаковая, это и есть "Base name for BLAST files". Рекомендуется сделать это "базовое имя" коротким (например, "st" для генома S.typhimurium).
Для запуска программы командная строка должна содержать для каждого из задаваемых параметров его название, а затем после пробела его значение. Это стандартный способ указывать значения параметров в консольных приложениях UNIX. Выглядит это так:
program -param1 value1 -param2 -value2(параметров может быть сколько угодно; их порядок, как правило, неважен).
Запустите blastall без параметров, чтобы получить подсказку список параметров программы. Вам понадобятся следующие параметры: -p (его возможные значения blastp, blastn и т.д., строчными буквами!), -d (базовое имя индексных файлов), -i (входной файл), -o (выходной файл), и, возможно, -e (см. также BLAST help).
entret embl:X00000 -autoили через SRS.
Набирать получившуюся длинную командную строку неудобно; к тому же
приходится трижды набирать один и тот же путь
Заведите переменную "genpath" (имя может быть и другим), выполнив команду:
genpath=/home/export/samba/public/tmpВ этом выражении не должно быть никаких пробелов. Затем заведите другую переменную:
genomes="$genpath/st_genome.fasta $genpath/xc_genome.fasta $genpath/pm_genome.fasta"Здесь мы пользуемся тем, что в двойных кавычках (в отличие от одинарных), знак $ сохраняет специальное значение вызова содержимого переменной.
Теперь можно запускать formatdb, указывая "$genomes" в
качестве значения параметра
При запуске blastall не забудьте дать выходному файлу иное имя, чем в прошлый раз; желательно (как и всегда), чтобы имя тем или иным образом намекало на содержимое файла.