Описание программы

Описание команды infoseq биоинформатического пакета EMBOSS с примерами использования.

1. Открытие терминала linux.

Запускаем Putty, заходим на сервер kodomo про помощи совего логина и пароля.

2.Создание дирректории Pr1.

С помощью команды mkdir создаем в домашней директории директрорию Term2, переходим в неё при помощи команды cd переходим в ~/Term2. Аналогично создем директорию Block1, в ней директорию Practices, и уже в директории Practices создаем директорию Pr1.

3.Получение информации о белке.

Вводим команду infoseq sw:ptas_bacsu на экран выдалась информация в виде таклицы:
USA Database Name Accession Type Length Organism Description
sw-id:PTAS_BACSU sw PTAS_BACSU P39646 P 323 Bacillus subtilis Phosphate acetyltransferase (2.3.1.8) (Phosphotransacetylase) (Vegetative protein 43) (VEG43)

C помощью команды infoseq sw:ptas_bacsu > ptas_bacsu.info запишем эту информацию в файл ptas_bacsu.info .

4.Записание информации о программе infoseq в файл.

Стандартные потоки:

  • stdin - стандартый поток ввода, содежащий информацию, вводимую пользователем. Номер, соответствующий потоку,: 0
  • stdout - стандартный поток вывода, содержащий информацию, зарезервираванную для вывода данных. Номер, соответствующий потоку,: 1
  • stderr - стандартный поток ошибок, содержащий информацию, зарезервираванную для вывода данных о распространенных ошибках и их возможных причинах. Номер, соответствующий потоку,: 2

  • Информация, подающаяся на вывод, содержит стандартные потоки stdout и stderr.
    Способы перенаправления вывода информации:
  • Символ > переводит стандартный поток stdout в файл , если же в файле уже что-то было написано, то вся предыдущая информация сотрется.
  • Примеp: infoseq sw:ptas_bacsu > ptas_bacsu.info
  • Символ >> переводит стандартный поток stdout в файл, но не стирает предыдущую информацию, а просто дописывает нужный нам поток.
  • Пример: infoseq sw:ptas_bacsu >> ptas_bacsu.info
  • Символ | переводит стандартный поток stdout одной программы, как стандартный поток stdin другой.
  • Пример: ls | wc
    Для того, чтобы перенаправить только один поток данных нужно перед символом перенаправления написать номер потока. Для выполнения задания введем команду infoseq -help 2>> ptas_bacsu.info, так как нужные нам данные относятся к stderr.

    Cпецсимволы.

    1. Пробел и символ табуляции отделяют параметры друг от друга.
    2. Кавычки и обратная косая черта ("",'', \) используются для передаче программам параметров, содержащих спецсимволы (например, имен файлов с пробелами).

    3. В двойных кавычках символы $ и ` (обратные кавычки) сохраняют специальное значение (вызов содержания переменной и подстановка вывода другой команды соответственно); кроме того, сочетание \$ превращается в (буквальный) символ $, \" — в символ ", а \` — в символ ` (обратная кавычка). Все остальные символы воспринимаются буквально.
    4. Сочетание \ с любым символом превращается в этот символ.
    5. Звездочка *, вопросительный знак ? и квадратные скобки [ ] используются для "масок" имен файлов. Например [0-9]* превращается bash-ем в список всех файлов текущей директории, чье название начинается с цифры.
    6. Символы >, < и | предназначены для работы со стандартными потоками .
    7. Символ ! можно использовать для вызова команды из журнала команд (просмотреть журнал можно, выполнив команду history).
    8. Пользуясь символом ; можно исполнить одной строкой последовательность из двух или более команд — этот символ разделяет строку на последовательно выполняемые команды.
    9. Для выполнения заданий мы использовали символ ‘звездочка (*)‘. Напримеp: infoseq sw:*t*s_bacsu.

      5.(6.)Использование "*" в имени последовательности для поиска таких же белков в других видах рода Bacillus.

      Введем командуinfoseq sw:ptas_bac*, ответом на неё оказалась информация только о нашем белке, тогда введем команду infoseq sw:*as_bac* (так как это одна из команд, дающих результат, которых подходит под нужное количество строчек), проверим командой infoseq sw:*as_bac* | wc количество строчек. Команда wc дала результат: 11 131 1592, то есть количество строчек, выводимое командой infoseq sw:ptas_bac* равно 11.
      Сохраним полученный результат в файл с помощью команды infoseq sw:*as_bac* 1>> ptas_bacsu.info
      Аналогично сохраним результат команды infoseq sw:*t*s_bacsu, дающую информацию о 14 белках, в файл с помощью команды infoseq sw:*t*s_bacsu 1>> ptas_bacsu.info.

      Файл ptas_bacsu.info, содержащий результаты, можно скачать здесь.

      7. Описание программы infoseq и её параметров.

      Опция Описание Пример
      outfile Указывает имя для вывода информации infoseq sw:ptas_bacsu - outfile file
      html Форматирование получаемой таблицы как HTLM - таблицы infoseq sw:ptas_bacsu -html
      heading Указывает имя файла для вывода информации infoseq sw:ptas_bacsu -heading h
      columns Оформление в виде колонок infoseq sw:ptas_bacsu -columns c
      only Способ сокращения командной строки, для отображения только некоторых вещей infoseq sw:ptas_bacsu - only -length
      delimiter Разделитель для информации в полученом тексте (пробел) infoseq sw:ptas_bacsu - columns n -delimiter ''
      usa Отображение USA последовательности infoseq sw:ptas_bacsu - only -usa 1


      © Butusova Anna,2012