Командная оболочка bash
bash — одна из наиболее популярных современных разновидностей командной оболочки UNIX. Особенно популярна в среде Linux, где она часто используется в качестве предустановленной командной оболочки.
В bash процесс взаимодействия с пользователем выполняется в терминах записи и чтения в файл. То есть вывод на экран представляется как запись в файл, а ввод — как чтение файла. Файл, из которого осуществляется чтение, называется стандартным потоком ввода, а в который осуществляется запись — стандартным потоком вывода. Кроме потоков ввода и вывода, существует еще и стандартный поток ошибок, на который выводятся все сообщения об ошибках и те информативные сообщения о ходе работы программы, которые не могут быть выведены в стандартный поток вывода.
Стандартные потоки привязаны к файловым дескрипторам с номерами 0, 1 и 2.
- Стандартный поток ввода (stdin) — 0;
- Стандартный поток вывода (stdout) — 1;
- Стандартный поток ошибок (stderr) — 2.
Вывод данных на экран и чтение их с клавиатуры происходит потому, что по умолчанию стандартные потоки ассоциированы с терминалом пользователя. Это не является обязательным — потоки можно подключать к чему угодно — к файлам, программам и даже устройствам. В командном интерпретаторе bash такая операция называется перенаправлением.
| < файл | Использовать файл как источник данных для стандартного потока ввода. |
| > файл | Направить стандартный поток вывода в файл. Если файл не существует, он будет создан; если существует — перезаписан сверху. |
| 2> файл | Направить стандартный поток ошибок в файл. Если файл не существует, он будет создан; если существует — перезаписан сверху. |
| >>файл | Направить стандартный поток вывода в файл. Если файл не существует, он будет создан; если существует — данные будут дописаны к нему в конец. |
| 2>>файл | Направить стандартный поток ошибок в файл. Если файл не существует, он будет создан; если существует — данные будут дописаны к нему в конец. |
| &>файл или >&файл | Направить стандартный поток вывода и стандартный поток ошибок в файл. |
| | программа | Направить стандартный поток вывода в программу. |
Ряд символов вопринимается интерпретатором командной строки bash не буквально, а как указания произвести некоторые операции. Это следующие символы:
| > | перенаправление вывода |
| < | перенаправление ввода |
| &1 | указатель на поток 1(stdout). Если после >& ничего не стоит, то подразумеваются оба выводных потока |
| / | корень файловой системы |
| ./ | текущая директория |
| ../ | родительская директория |
| ~/ | домашняя директория |
| * | набор из любых символов |
| 'текст' | все символы (кроме, естественно, самой одинарной кавычки) воспринимаются буквально |
| ! | вызов команды из журнала |
| ; | разделяет строку на последовательно выполняемые команды |
Например:
ls -l | wc -l > /documents/work/file.txt
Вывели построчно содержимое текущей папки, посчитали количество этих строк и перенаправили результат в файл fail.txt, лежащий в поддериктории work директории documents.
Программный пакет Emboss
EMBOSS(акроним European Molecular Biology Open Software Suite)-бесплатный пакет программного обеспечения, специально разработанный для нужд молекулярной биологии и биоинформатики.
infoseq-команда выводящая краткую информацию о последовательности, такую как: Uniform Sequence Address, название, код доступа, тип(белок/нуклеиновая кислота), длина, процент пар Ц+Г, описание.
Синтаксис команды следующий: infosec [имя базы данных]: [идентификатор в этой базе]
| Опция | Описание |
| -outfile | Ввести имя файла в который программа запишет найденную информацию |
| -html | Вывести информацию в виде таблицы HTML |
| -only | Вывести только указанный далее параметр |
| -heading | Показать заголовки таблицы|
| -usa | Показать Uniform Sequence Address |
| -name | Показать название |
| -accession | Показать код доступа |
| -type | Показать тип |
| -length | Показать длину |
| -pgc | Показать процент Г+Ц пар |
| -description | Показать описание |
| -help | Вывести описание программы и всех опций |
Пример:
infoseq sw:pdxt_bacsu -only -name -accession -length -html
Display basic information about sequences
| Name | Accession | Length |
|---|---|---|
| PDXT_BACSU | P37528 | 196 |