Вернуться на страницу семестров

Описания программ


bash — усовершенствованная и модернизированная вариация командной оболочки Bourne shell. Одна из наиболее популярных современных разновидностей командной оболочки UNIX. Особенно популярна в среде Linux, где она часто используется в качестве предустановленной командной оболочки. (данное определние взято из Википедии)

Используемые потоки. Информация обладает свойствами ввода и вывода. Ниже представлены определения.

1) stdout — стандартный вывод программы. Причем данный поток возможно перенаправить с помощью символа ">", в определенный файл, файл перезаписывается поступающими данными. Если пользователь желает дополнить(дописать) предыдущую информацию файла, то нужно воспользоваться символом ">>", который добавляет данные в конец файла. Номер потока 1. Пример, используемый в данном практикуме:
infoseq sw:OPUAC_BACSU > fail.txt
2) stdin — стандартный ввод. То, что набирает пользователь в консоли. Все другие потоки можно перенаправлять в stdin, используя символ "<". Номер потока 0.
3) stderr — стандартный вывод ошибок. Выводит ошибки, причем "2>" направляет stderr в файл. "2>>" дописывает stderr в файл. Номер потока 2. 4) конвейер, обозначаемый знаком "|". Перенаправляет поток stdout одной команды на поток stdin другой команды.

Спецсимволы. Это символы, которые воспринимаются консолью bash, и служат для удобства при выполнении каких-либо функций. Наиболее часто используемые:

1 группа(ковычки)
" - все что записано в них объединяется, но не интерпретируется
"" - все что записано в них объединяется, и интерпретируется полностью

2 группа(знаки замены, маски)
* - замена любого количества символов
? - замена одного символа

3 группа(пробел и знак табуляции)
tab - отделяет функции(параметры) друг от друга

4 группа(дополнительные)
~ - домашняя директория
; - последовательная запись команд


EMBOSS (European Molecular Biology Open Software Suite) - специальный пакет команд, необходимый для биоинформатических и микробиологических целей. На данном этапе будет рассмотрена команда infoseq и многие её возможности. (расшифровка EMBOSS взята с википедии)
Команда infoseq выдает желаемую нам информацию о белке, а именно его имя, место открытия, и другую информацию. Для получения этой информации нужно записать синтаксис после команды infoseq. Ниже преставлены синтаксисы:
Основной параметр
infoseq -help - позволяет узнать возможности других параметров.

1) Стандратный параметр
infoseq -sequence - вывод информации с данным синтаксисом равносилен выводу без синтаксиса, пример:
(infoseq -sequence sw:opuac_bacsu >> fail.txt) = (infoseq sw:opuac_bacsu >> fail.txt)

2) Дополнительные параметры
infoseq -outfile fail.txt sw:opuac_bacsu - записывает информацию о последовательностях белка в данный файл
infoseq -html sw:opuac_bacsu > fail.txt - выводит результат о свойствах белка

3) Характеристические параметры
infoseq -only - параметр, позволяющий выбрать конкретные параметры белка, следующие команды работают только с ним:
-usa -> показывает id белка
-database -> показывает базу данных, откуда берется информация о последовательности белка
-name -> имя белка(br) -accession -> идентификатор UniProt
-type -> тип белка
-length -> длина последовательности
-pgc -> процент G-C пар азотистых оснований
-organism -> огранизмы, в которых есть данный белок
-description -> описание

infoseq -columns - показывает информацию с колонками

infoseq -no(команда) - пишется слитно с командой и не выполняет именно её

infoseq -delimiter - команда, разделяющая слова в файле