Описание программ


Bash


Потоки
stdin СТАНДАРТНЫЙ ПОТОК ВВОДА. Содержит то, что вы набираете на клавиатуре во время работы программы (например, в ответ на вопросы программы)
stdout СТАНДАРТНЫЙ ПОТОК ВЫВОДА и СТАНДАРТНЫЙ ПОТОК ОШИБОК, но по умолчанию их содержание отображается в консольном окне (потоки не разделены). Но если перенаправить stdout на stdin другой программы или в файл, можно разделить эти два потока. stderr же будет продолжать выводиться на экран.
stderr

Операторы перенаправления потоков
Символ > Для перенаправления стандартного вывода (stdout) команды в файл например, команда infoseq sw:SPSE_BUSCU > SPSE.info запишет в файл SPSE.info информацию из банка SwissProt (создаст его в текущей директории или перезапишет уже имеющийся файл с таким названнием).
сочетание символов >> дописать stdout команды в конец уже существующего файла например, команда infoseq sw:"SPS*_BACSU" >> SPSE.info дозапишет в конец файла информацию о всех найденных в банке белков комплекса SPSE в Bacillus Subtales.
USA Database Name Accession Type Length Organism
Description
sw-id:SPSE_BACSU sw SPSE_BACSU P39625 P 373 Bacillus subtilis Spore coat polysaccharide biosynthesis protein spsE
USA Database Name Accession Type Length Organism
Description
sw-id:SPSA_BACSU sw SPSA_BACSU P39621 P 256 Bacillus subtilis Spore coat polysaccharide biosynthesis protein spsA
sw-id:SPSB_BACSU sw SPSB_BACSU P39622 P 474 Bacillus subtilis Spore coat polysaccharide biosynthesis protein spsB
sw-id:SPSC_BACSU sw SPSC_BACSU P39623 P 389 Bacillus subtilis Spore coat polysaccharide biosynthesis protein spsC
sw-id:SPSD_BACSU sw SPSD_BACSU P39624 P 289 Bacillus subtilis Spore coat polysaccharide biosynthesis protein SpsD (2.3.1.-)
sw-id:SPSE_BACSU sw SPSE_BACSU P39625 P 373 Bacillus subtilis Spore coat polysaccharide biosynthesis protein spsE
sw-id:SPSF_BACSU sw SPSF_BACSU P39626 P 240 Bacillus subtilis Spore coat polysaccharide biosynthesis protein spsF
sw-id:SPSG_BACSU sw SPSG_BACSU P39627 P 339 Bacillus subtilis Spore coat polysaccharide biosynthesis protein spsG
sw-id:SPSI_BACSU sw SPSI_BACSU P39629 P 246 Bacillus subtilis Spore coat polysaccharide biosynthesis protein spsI
SPS*BACSU.info
сочетание символов 2> записать в файл stderr например, найдём файлы, содержащие выражение "bacsu" на диске P. Это делает команда find /P/ -name '*bacsu.*'. Команда выдает несколько результатов поиска и две ошибки. Чтобы разделить strout и strerr, используем указанные команды:
команда find /P/ -name '*fasta*' 1> 1.txt запишет в файл 1.txt результаты поиска (найденные файлы). 1.txt
команда find /P/ -name '*fasta*' 2> 2.txt запишет в файл 2.txt обнаруженные ошибки при поиске. 2.txt
Спецсимволы bash
Символ Значение Пример
Пробел и символ табуляции отделяют параметры друг от друга infoseq sw:spse_bacsu -only -name
" " Все символы внутри вопринимаются буквально, кроме $ и `. Эти символы сохраняют своё значение. Но если перед ними поставить \, то и они будут воприниматься буквально. mv "A gift.GIF" A_gift.GIF Без кавычек эта команда не выполнялась
Advanced (Unprompted) qualifiers:
' ' Внутри одиночных кавычек, любой специальный символ, за исключением ', интерпретируется как простой символ. Одиночные кавычки - более строгий вариант чем двойные кавычки less 'yes\no' символ \ - часть имени файла.
Маски поиска
* Некоторое множество символов (пустое в том числе) find ~ -name *.fasta команда будет искать в домашней директории файлы, имя которых оканчивается на peptid.txt
? Один символ find ~ -name ?.fasta На месте ? один символ
[0-9] цифра от 0 до 9. может быть и алфавит find ~ -name [0-9].fasta
Команда grep
Ищет в текстовом файле строки, содержащие некоторое выражение. Можно действовать этой командой на результат стандартного вывода, например infoseq "sw:*_bacsu" | grep chaperonin выводит на экран информацию обо всех белках вида Bacillus Subtilis, а затем среди полученных строчек ищет содержащие слово enzyme. Таким образом, можно выявить все белки-ферменты данного вида.
Команда различает некоторые спецсимволы: точка вместо любого символа, [0-9] цифра от 0 до 9, [аб] - буква "а" или "б", ^ - начало строки, $ - конец строки, \ - последующий символ воспринимается программой буквально


2. EMBOSS


Опции команды infoseq
Опция Действие Пример
Добавочные (опциональные) квалификаторы:
-outfile Если ввести сюда имя файла, программа запишет детали последовательности в файл. outinfo.txt
infoseq sw:spse_bacsu -outfile outinfo.txt
-html Результат в формате HTML-таблицы. htmlinfo.txt
infoseq sw:spse_bacsu -html 1> htmlinfo.txt
Квалификаторы:
-[no]columns Включите эту опцию(Y), чтобы получить информацию о последовательности в виде стройного, выровненного по колонкам файла выходных данных.Либо, отключите эту опцию (N), и в данном случае информация будет отделена символом, который можно задать с помощью опции -delimiter. nocolinfo.html
colinfo.txt
infoseq sw:spse_bacsu -nocolumns 1> nocolinfo.txt
infoseq sw:spse_bacsu -columns 1> colinfo.txt
-delimiter Используется для разделения разделов в выходном файле. Это может быть пробел, символ табуляции или любой другой символ. delinfo.txt
infoseq sw:spse_bacsu -nocolumns -delimiter "!" 1> delinfo.txt
-only Укорачивает выводимую информацию. Только -only: '-nohead -noname -noacc -notype -nopgc -nodesc' only.txt
infoseq sw:spse_bacsu -only -length 1> only.txt
-[no]heading Отображает названия колонок. head.txt
nohead.txt
infoseq sw:spse_bacsu -heading 1> head.txt
infoseq sw:spse_bacsu -noheading 1> nohead.txt
-usa Отображает "адрес последовательности в банке данных Uniform (Uniform Sequence Address). Употребляется только с -only. usa.txt
infoseq sw:spse_bacsu -only -usa 1> usa.txt
-database Отображает колонку 'database'. Употребляется только с -only. database.txt
infoseq sw:spse_bacsu -only -database 1> database.txt
-name Отображает колонку 'name'. Употребляется только с -only. name.txt
infoseq sw:spse_bacsu -only -name 1> name.txt
-accession Отображает колонку 'accession'.Употребляется только с -only. accession.txt
infoseq sw:spse_bacsu -only -accession 1> accession.txt
-gi Отображает колонку 'GI'. Употребляется только с -only. gi.txt
infoseq sw:spse_bacsu -only -gi 1> gi.txt
-seqversion Отображает колонку 'version'. Употребляется только с -only. vers.txt
infoseq sw:spse_bacsu -only -seqversion 1> vers.txt
-type Отображает колонку 'type'. Употребляется только с -only. type.txt
infoseq sw:spse_bacsu -only -type 1> type.txt
-length Отображает колонку 'length'. Употребляется только с -only. length.txt
infoseq sw:spse_bacsu -only -length 1> length.txt
-pgc Отображает процентное содержание rуанина и цитозина. Употребляется только с -only. pgc.txt
infoseq sw:spse_bacsu -only -pgc 1> pgc.txt
-organism Отображает колонку 'organism'. Употребляется только с -only organism.txt
infoseq sw:spse_bacsu -only -organism 1> organism.txt
-description Отображает колонку 'description'. Употребляется только с -only. description.txt
infoseq sw:spse_bacsu -only -description 1> description.txt
Главные квалификаторы:
-help Выводит информацию о команде infoseq help.txt
infoseq -help 2> help.txt