EMBOSS (European Molecular Biology Open Software Suite) - свободно распространяемый пакет программ, разработанных для нужд молекулярной
биологии.
Команда
infoseq позволяет получить основную информацию о последовательностях
(белков, ДНК). Параметры создаются для базового запроса, синтаксис которого выглядит следующим образом:
infoseq <база данных>:<код белка>_<код организма>.
Для примера, запрос в базу данных SwissProt по изучаемому мною белку YPWA выглядит следующим образом:
infoseq sw:ypwa_bacsu.
Различные опции этой команды позволяют получить разный набор данных.
-outfile |
Вывод данных в файл |
-html |
Вывод данных в виде кода html-таблицы |
-[no]columns |
Данные располагаются по колонкам или без |
-help |
Помощь по команде |
-only |
Позволяет ограничивать тип выводимой информации, требует дополнительных указаний на требуемые параметры |
Следующие флаги работают только с
-only, выводя следующие типы данных:
-usa |
USA (Uniform Sequence Address) - краткое единое название белка |
-database |
База данных |
-name |
Имя белка |
-accession |
Код доступа |
-type |
Тип последовательности (белковая,..) |
-length |
Длина продукта |
-organism |
Организм-хозяин |
-description |
Описание |
Примеры
- infoseq -only -usa -description -length sw:ypwa_bacsu -type -accession -html
USA | Accession | Type | Length | Description |
sw-id:YPWA_BACSU | P50848 | P | 501 | Putative metalloprotease YpwA (3.4.24.-) |
- infoseq -only -length sw:ypwa_bacsu
- infoseq -only -name -accession -description -length sw:ypwa_bacsu -html
Name | Accession | Length | Description |
YPWA_BACSU | P50848 | 501 | Putative metalloprotease YpwA (3.4.24.-) |
BASH (от
Bourne again shell) - усовершенствованный вариант командной оболочки Bourne shell,
который может работать как в интерактивном режиме, так и читая команды из файла (скрипта).
Потоки
- stdin (вводной поток) - данные, которые поступают программе
- stdout (выводной поток) - результат действия программы
- stderr (поток ошибок) - вывод об ошибках
Оба последних потока выводятся на экран, поэтому не всегда можно точно установить, какой именно поток
показан на экране. Поэтому существуют специальные символы, позволяющие отделять потоки друг от друга.
> или 1> |
Перенаправляет в файл только stdout |
>> или 1>> |
Данные stdout добавляется в конец файла |
2> |
Перенаправляет в файл только stderr |
2>> |
Данные stderr добавляется в конец файла |
>& |
Перенаправляет оба выходных потока |
2>&1 |
Перенаправляет stderr на stdout |
com1 | com2 |
Перенаправляет stdout команды 1 на stdin команды 2 |
Специальные символы Bash
~user |
Домашняя директория пользователя |
/ |
Корневая директория |
./ |
Текущая (рабочая)директория |
../ |
Родительская директория по отношению к рабочей |
* |
Маска, задающая любое количество любых символов |
? |
Маска, задающая один любой символ |
\ |
Воспринимает следующий после \ символ буквальным образом |
[диапазон] |
Маска, задающая поиск на файл с любым символом из диапазона |
'word' |
Имя файла, содержащее word с нестандартными символами, воспринимается буквально всегда |
"word" |
Имя файла, содержащее word с нестандартными символами, воспринимается буквально почти всегда |
; |
Позволяет разделять последовательно записанные команды |
! |
Вызов команды из журнала команд |
Примеры
- Найти файл .txt с цифрой в названии:
*[1-9]*.txt
- Сохранить результаты операции (напр., содержимое папки dir) в существующий файл:
ls -1 dir >> filename
- Перейти в сестринскую директорию dir:
cd ../dir
© Elizaveta Besedina, FBB 2012
lizaveta@kodomo.fbb.msu.ru