Создание описания команды infoseq биоинформатического пакета EMBOSS с примерами использования.
1. Терминал linux.
В ОС Windows запустили Putty и зашли на сервер kodomo, используя свой логин и пароль.
Командой pwd убедились, что находимся в домашней директории: /home/students/y11/janemoiseeva
2. Создаем директорию Pr1.
Командой mkdir в домашней директории создаем директорию Term2 (mkdir ~/Term2), в ней - директорию Block1 (mkdir ~/Term2/Block1), в ней - директорию Practices (mkdir ~/Term2/Block1/Practices), в ней - директорию Pr1 (mkdir ~/Term2/Block1/Practices/Pr1). Командой (ls ~/путь к директории) можно проверить ее содержимое и убедиться, что папки появились.
Для выполнения заданий перейдем в директорию Pr1 (cd ~/Term2/Block1/Practices/Pr1).
3. Получим информацию о своем белке.
Команда infoseq sw:guad_bacsu выдает на терминал информацию о записи GUAD_BACSU банка SwissProt.
Запишем информацию об этом белке в файл с именем GUAD_BACSU.info (infoseq sw:guad_bacsu 1> GUAD_BACSU.info) GUAD_BACSU.info
(Командой infoseq sw:GUAD_BACSU -html 1>html.info можно представить эту информацию ввиде таблицы)
USA | Database | Name | Accession | Type | Length | Organism | Description |
---|---|---|---|---|---|---|---|
sw-id:GUAD_BACSU | sw | GUAD_BACSU | O34598 | P | 156 | Bacillus subtilis | Guanine deaminase (GDEase) (Guanase) (Guanine aminase) (3.5.4.3) (Guanine aminohydrolase) (GAH) |
4. Запишем информацию о программе infoseq в файл.
Для этогго можно использовать разные опции:
infoseq –help 2> infoseq.info (infoseq.info)
man infoseq >infoseq1.info (infoseq1.info)
5. Используя "*" в имени последовательности найдите такие же белки в других видах рода Bacillus (infoseq sw:guad_bac* 1> other1.info). Таких не оказалось.
6. Повторите команду из предыдущего задания, используя разные опции изменения выдачи результата.
infoseq sw:guad_bac* 0> other0.info (other0.info)
infoseq sw:guad_bac* 1> other1.info (other1.info)
infoseq sw:guad_bac* 2> other2.info (other2.info)
другие опции и примеры см. 7.
7. The description of command infoseq and it's qualifiers.
Qualifier | Function | Example |
-outfile | If you enter the name of a file here then this program will write the sequence details into that file. | infoseq sw:GUAD_BACSU -outfile outfile.infooutfile.info |
-html | Format output as an HTML table | infoseq sw:GUAD_BACSU -html 1> html.infohtml.info |
-[no]columns | Set this option on to print the sequence information into neat, aligned columns in the output file. Alternatively, leave it unset (N), in which case the information records will be delimited by a character, which you may specify by using the -delimiter option. In other words, if -columns is set on, the -delimiter option is overriden. | infoseq sw:GUAD_BACSU -columns 1> columns.infocolumns.info infoseq sw:GUAD_BACSU -nocolumns 1> nocolumns.infonocolumns.info |
-delimiter | This string, which is usually a single haracter only, is used to delimit individual records in the text output file. It could be a space character, a tab character, a pipe character or any other character or string. | infoseq sw:GUAD_BACSU -nocolumns -delimiter "))" 1> delimiter.infodelimiter.info |
-only | This is a way of shortening the command line if you only want a few things to be displayed. | infoseq sw:GUAD_BACSU -only -length 1> onlylength.info/onlylength.info |
-[no]heading | Display column headings | infoseq sw:GUAD_BACSU -heading 1> heading.infoheading.info(по умолчанию) infoseq sw:GUAD_BACSU -noheading 1> noheading.infonoheading.info |
-usa | Display the USA of the sequence. Only with -only | infoseq sw:GUAD_BACSU -only -usa 1> usa.infousa.info |
-database | Display 'database' column. Only with -only | infoseq sw:GUAD_BACSU -nodatabase 1> nodatabase.info(по умолчанию эта колонка есть) gi.info |
-name | Display 'name' column. Only with -only | infoseq sw:GUAD_BACSU -only -name 1> name.infogi.info |
-accession | Display 'accession' column. Only with -only | infoseq sw:GUAD_BACSU -only -accession 1> accession.infogi.info |
-type | Display 'type' column. Only with -only | infoseq sw:GUAD_BACSU -only -type 1> type.infogi.info |
-length | Display 'length' column. Only with -only | infoseq sw:GUAD_BACSU -only -length 1> onlylength.infogi.info |
-organism | Display 'organism' column. Only with -only | infoseq sw:GUAD_BACSU -only -organism 1> organism.infogi.info |
-description | Display 'description' column. Only with -only | infoseq sw:GUAD_BACSU -only -description 1> description.infogi.info |
-gi | Display 'GI' column | infoseq sw:GUAD_BACSU -gi 1> gi.info(по умолчанию не выводится) gi.info |
-seqversion | Display 'version' column | infoseq sw:GUAD_BACSU -seqversion 1> seqversion.infogi.info |
-pgc | Display 'percent GC content'column. Only with -only | infoseq sw:GUAD_BACSU -pgc 1> pgc.infogi.info |
-help | Report command line options and exit. More information on associated and general qualifiers can be found with -help -verbose | infoseq sw:GUAD_BACSU -help 2> help.infohelp.info |
8. The description of command showdb.
showdb is a command line program from EMBOSS. It displays information on configured databases.
Qualifiers: -database, -html, -protein, -nucleic,-full, -methods, boolean -fields, -defined, -release, -only, -heading, -type, -id, -query, -all -comment, -outfile.
See more: man showdb manshowdb.txt
9. The description of command entret.
entret is a command line program from EMBOSS. It retrieves sequence entries from flatfile databases and files
Qualifiers: -sequence,-firstonly, -outfile. See more: man entret manentret.txt
bash
1. Некоторые команды.pwd | сообщает полное имя текущей директории |
ls | показывает содержимое текущей директории |
cp <имя файла 1> <имя файла 2> | копирует файл 1 в файл 2 |
mv <имя файла 1> <имя файла 2> | переименовывает файл |
mv <имя файла> <имя поддиректории> | перемещает файл в поддиректорию |
rm <имя файла> | уничтожает файл |
mkdir <имя поддиректории> | создает поддиректорию |
cd <имя поддиректории> | переход в поддиректорию |
cd .. | выход из поддиректории (переход в родительскую директорию) |
more <имя файла> | просмотр содержимого файла (клавишами "пробел" и "Enter") |
man <команда> | выдает подробную информацию о команде |
wc | подсчитывает число строк, слов и байт в файле |
2. Стандартные потоки.
Существует 3 вида стандартных потоков: stdin, stdout и stderr.
stdin | стандартный поток ввода | по умолчанию содержит то, что набирается на клавиатуре во время работы программы (например, в ответ на вопросы программы) |
stdout | стандартный поток вsвода | по умолчанию содержание отображается в консольном окне |
stderr | стандартный поток ошибок | по умолчанию содержание отображается в консольном окне |
Различить stdout и stderr нельзя. Можно перенаправить stdout на stdin другой программы или в файл, при этом stderr будет продолжать выводиться на экран.
3. Перенаправление вывода
Символ > используется для перенаправления стандартного вывода (stdout) команды в файл. Например, команда
echo hi > hi.txt hi.txt echo bye > bye.txtприведет к тому, что "hi" будет записано в файл hi.txt. При этом, если файл с таким именем уже существовал, то его старое содержимое исчезнет.
Чтобы дописать stdout команды в конец уже существующего файла, используется сочетание символов >>. Например, команда
cat hi.txt >> bye.txt hi.txt bye.txtприведет к тому, что в файле bye.txt после его старого содержимого окажется еще и содержимое файла hi.txt По команде cat на на экран выводится содержимое указанного. файла.
Чтобы записать в файл stderr можно применить сочетание символов 2>, например:
ls -help 2> lsstderr.help lsstderr.help
Для направления stdout одной команды на вход (stdin) другой команды используется "pipe" (конвейер), задаваемый знаком |, например:
ls -l | moreпозволяет просмотреть программой more информацию о файлах в текущей директории.
4. Спецсимволы bash.
Ряд символов вопринимается интерпретатором командной строки bash не буквально, а как указания произвести некоторые операции. Пробел и символ табуляции отделяют друг от друга параметры.
Разные кавычки (одинарные, двойные и обратные) указывают bash воспринимать команды по-разному:
' - символы в таких кавычках воспринимаются буквально; выражение объединяется, но команда, если такая есть в выражении, не распознается как команда.
" - выражение в двойных кавычках объединяется и интерпретируется (т.е. команды распознаются как команды и т.п.); символы $ и ` имеют специальное значение (вызов содержания переменной и подстановка вывода другой команды соответсвтенно); сочетание \ с любым символом превращается в этот символ.
` - выражение в обратных кавычках интерпретируется. Для поиска файлов часто удобно использовать *, ? и [ ]. * заменяет собой любые символы или их отсутствие. ? заменяет какой-либо один символ. С помощью [ ] можно задавать диапазон цифр или букв, например, запись [3-9] обозначает? что будут находиться файлы, где есть любая цифра от 3 до 9.
Символ ! можно использовать для вызова команды из журанала команд. Журнал команд можно посмотреть, выполнив команду history. Выполение команды, записанной в журнале по номером, например, 8, сделать командой: !8.
Символ ; используется для разделения строки на последовательно выполняемые команды. Например,
cd <имя директории ; lsсначала перейти в другую директорию, а затем показать её содержимое.
Поподробнее можно посмотреть, например тут.
5.Найти файл, имя которого содержит "bash_history"/
Искать файл необхожимо командой find. Чтобы осуществить поиск по имени, нужно использовать опцию -name. Так как мы не знаем поkyjuj имени файла, будем использовать символ * для создания маски поиска.
find ~ -name '*bash_history*'Теперь мы знаем место расположения искомого файла:
/home/students/y11/janemoiseeva/.bash_historybash при своем закрытии записывает в историю набранные за сеанс команды (не дописывает, а переписывает каждый раз).
Как мы видим, искомый файл начинается с точки, а команда ls по умолчанию игнорирует файлы, которые начинаются с точки, и для того, чтобы просмотреть список всех файлов этой командой, необходимо использовать опцию -a (a от "all">).
Перейдём в директорию, в которой находится искомый файл и выполним команду:
ls -aТеперь можно видеть список файлов этой директории, в котором присутствует искомый файл .bash_history. 6. Найти и переименовать файл с пробелом в имени.
Снова воспользуемся командой find, осуществим поиск по маске файла:
find ~ -name '* *'Мы получили список имен файлов, содержащих пробел. Выберем, например, файл /home/students/y11/janemoiseeva/notepad/Notepad++/themes/Plastic Code Wrap.xml. Скопируем его в рабочую директорию при помощи команды cp и переименуем так, чтобы пробела в имени не было:
cp /home/students/y11/janemoiseeva/notepad/Notepad++/themes/Plastic\ Code\ Wrap.xmlКомандой ls можно убедиться, что файл теперь не содержит пробела.
/home/students/y11/janemoiseeva/Term2/Block1/Practices/Pr1/Plastic_Code_Wrap.xml
Наверх