Командная оболочка bash


bash — одна из наиболее популярных современных разновидностей командной оболочки UNIX. Особенно популярна в среде Linux, где она часто используется в качестве предустановленной командной оболочки.

В bash процесс взаимодействия с пользователем выполняется в терминах записи и чтения в файл. То есть вывод на экран представляется как запись в файл, а ввод — как чтение файла. Файл, из которого осуществляется чтение, называется стандартным потоком ввода, а в который осуществляется запись — стандартным потоком вывода. Кроме потоков ввода и вывода, существует еще и стандартный поток ошибок, на который выводятся все сообщения об ошибках и те информативные сообщения о ходе работы программы, которые не могут быть выведены в стандартный поток вывода.

Стандартные потоки привязаны к файловым дескрипторам с номерами 0, 1 и 2.

Вывод данных на экран и чтение их с клавиатуры происходит потому, что по умолчанию стандартные потоки ассоциированы с терминалом пользователя. Это не является обязательным — потоки можно подключать к чему угодно — к файлам, программам и даже устройствам. В командном интерпретаторе bash такая операция называется перенаправлением.

< файлИспользовать файл как источник данных для стандартного потока ввода.
> файлНаправить стандартный поток вывода в файл. Если файл не существует, он будет создан; если существует — перезаписан сверху.
2> файлНаправить стандартный поток ошибок в файл. Если файл не существует, он будет создан; если существует — перезаписан сверху.
>>файлНаправить стандартный поток вывода в файл. Если файл не существует, он будет создан; если существует — данные будут дописаны к нему в конец.
2>>файлНаправить стандартный поток ошибок в файл. Если файл не существует, он будет создан; если существует — данные будут дописаны к нему в конец.
&>файл или >&файл Направить стандартный поток вывода и стандартный поток ошибок в файл.
| программаНаправить стандартный поток вывода в программу.

Ряд символов вопринимается интерпретатором командной строки bash не буквально, а как указания произвести некоторые операции. Это следующие символы:

> перенаправление вывода
< перенаправление ввода
&1 указатель на поток 1(stdout). Если после >& ничего не стоит, то подразумеваются оба выводных потока
/ корень файловой системы
./ текущая директория
../ родительская директория
~/ домашняя директория
* набор из любых символов
'текст' все символы (кроме, естественно, самой одинарной кавычки) воспринимаются буквально
!вызов команды из журнала
;разделяет строку на последовательно выполняемые команды

Например:
ls -l | wc -l > /documents/work/file.txt
Вывели построчно содержимое текущей папки, посчитали количество этих строк и перенаправили результат в файл fail.txt, лежащий в поддериктории work директории documents.



Программный пакет Emboss


EMBOSS(акроним European Molecular Biology Open Software Suite)-бесплатный пакет программного обеспечения, специально разработанный для нужд молекулярной биологии и биоинформатики.
infoseq-команда выводящая краткую информацию о последовательности, такую как: Uniform Sequence Address, название, код доступа, тип(белок/нуклеиновая кислота), длина, процент пар Ц+Г, описание.
Синтаксис команды следующий: infosec [имя базы данных]: [идентификатор в этой базе]

Таблица дополнительных опцийПоказать заголовки таблицы
ОпцияОписание
-outfileВвести имя файла в который программа запишет найденную информацию
-htmlВывести информацию в виде таблицы HTML
-onlyВывести только указанный далее параметр
-heading
-usaПоказать Uniform Sequence Address
-nameПоказать название
-accessionПоказать код доступа
-typeПоказать тип
-lengthПоказать длину
-pgcПоказать процент Г+Ц пар
-descriptionПоказать описание
-helpВывести описание программы и всех опций

Пример:
infoseq sw:pdxt_bacsu -only -name -accession -length -html
Display basic information about sequences

NameAccessionLength
PDXT_BACSU P37528196