Описание программ

EMBOSS (European Molecular Biology Open Software Suite)

EMBOSS - свободно распространяемый пакет программного обеспечения, специально разработанный для нужд молекулярных биологов. Пакет способен работать с данными в различных форматах, в том числе используя данные баз данных Интернета.

Команда infoseq:
  1. Описание команды: в ответ на введённый в командную строку запрос, содержащий название базы данных и идентификатор, команда infoseq возвращает информацию о последовательности полимера (белка либо нуклеиновой кислоты), которая содержит такие сведения как: универсальный код последовательности, базу данных, название, длину последовательности и описание гена/белка.
  2. Задание параметров команды:
  3. infoseq {название базы данных}:{идентификатор последовательности}_{название организма}

    Параметр Описание
    -outfile {file} перенаправляет результат действия в файл {file}
    -html позволяет представить результат действия программы как таблицу HTML
    -[no]columns включение/выключение вывода информации в виде колонок таблицы
    -only {parameter}
    • -usa
    • -database
    • -name
    • -type
    • -length
    • -description
    • -organism
    • -pgc
    позволяет выводить не всю информацию, а только необходимые пункты {parameter}
    • вывод Uniform Sequence Address - универсального кода последовательности
    • вывод названия базы данных
    • вывод названия гена/белка
    • вывод типа последовательности (белковая/нуклеотидная)
    • вывод длины последовательности
    • вывод описания последовательности
    • вывод названия организма
    • вывод процента GC пар (для нуклеиновых кислот)
    -help сообщает информацию о команде и её дополнительных опциях

  4. Примеры использования команды:
    Запрос: infoseq -html sw:cisy_bac* (поиск по базе SwissProt последовательностей цитратсинтаз внутри рода Bacillus) Результат:
    USADatabaseNameAccessionTypeLengthOrganismDescription
    sw-id:CISY_BACSUswCISY_BACSUP39119P366Bacillus subtilis (strain 168)Citrate synthase 1 (2.3.3.1) (Citrate synthase I)
    sw-id:CISY_BACCOswCISY_BACCOP27660P373Bacillus coagulansCitrate synthase (2.3.3.1)

    Запрос: infoseq -only -name -length -usa -description sw:AQPZ_ECOLI
    Результат:
    USA Name Length Description
    sw-id:AQPZ_ECOLI AQPZ_ECOLI 231 Aquaporin Z (Bacterial nodulin-like intrinsic protein)

Bash (Bourne again shell)

Bash — командный процессор, представляющий собой усовершенствованную и модернизированную вариацию командной оболочки Bourne shell. Работает в интерактивном режиме в текстовом окне, способен к работе со скриптами. Является одной из наиболее популярных современных разновидностей командной оболочки UNIX.

Всего в Bash используется три разных стандартных потока: Вывод данных может производиться не только в интерфейс программы, но и в файл, и в программу (выводной поток одной программы становится потоком входных данных для другой).
Оператор Описание
>{file} Перенаправляет результат действия в файл {file}. Если файла нет, он создаётся, если есть - перезаписывается.
>>{file} Перенаправляет результат действия в файл {file}. Если файла нет, он создаётся, если есть - дописывается.
<{file} Входные данные для работы команды берутся из файла {file}.
{programm1}|{programm2} Выходной поток {programm1} становится входным для {programm2}
1>{file} в файл перенаправляется только стандартный выводной поток
2>{file} в файл перенаправляется только выходной поток ошибок

Примеры использования:
1)w > file1 - записать всех подключённых пользователей в файл file1 текущей директории
2)less file1 | wc -l - посчитать количество строк в файле file1, используя перенаправление вывода его содержимого в команду подсчёта строк

Некоторые освоенные спецсимволы:

Дата последнего обновления: 20.02.2013
© Dmitry Travin, 2012