Описание программ

Задания:


3. Получить информацию о своем белке
Перейти в созданную директорию
cd ~/Term2/Block1/Practices/Pr1
Записать результат команды infoseq в файл
infoseq sw:spse_bacsu > spse_bacsu.info
(результат можно записать в виде таблицы)
infoseq sw:spse_bacsu -html
USADatabaseNameAccessionTypeLengthOrganismDescription
sw-id:SPSE_BACSUswSPSE_BACSUP39625P373Bacillus subtilisSpore coat polysaccharide biosynthesis protein spsE

4. Записать информацию о программе infoseq в файл
Так как команда выдает как stdout, так и stderr, то для записи в файл используем infoseq -help 2> infoseq.tzt
Вот этот файл infoseq.txt
5. Используя "*" в имени последовательности, найти такие же белки в других видах рода Bacillus
К сожалению, ни в каких других видах рода Bacillus мой белок не встречается. Поэтому можно найти все белки суперкомплекса SPS в бактерии вида Bacillus Subtilis
infoseq sw:sps*_bacsu 1> anprotein.txt
Вот этот файл anprotein.txt
USADatabaseNameAccessionTypeLengthOrganismDescription
sw-id:SPSA_BACSUswSPSA_BACSUP39621P256Bacillus subtilisSpore coat polysaccharide biosynthesis protein spsA
sw-id:SPSB_BACSUswSPSB_BACSUP39622P474Bacillus subtilisSpore coat polysaccharide biosynthesis protein spsB
sw-id:SPSC_BACSUswSPSC_BACSUP39623P389Bacillus subtilisSpore coat polysaccharide biosynthesis protein spsC
sw-id:SPSD_BACSUswSPSD_BACSUP39624P289Bacillus subtilisSpore coat polysaccharide biosynthesis protein SpsD (2.3.1.-)
sw-id:SPSE_BACSUswSPSE_BACSUP39625P373Bacillus subtilisSpore coat polysaccharide biosynthesis protein spsE
sw-id:SPSF_BACSUswSPSF_BACSUP39626P240Bacillus subtilisSpore coat polysaccharide biosynthesis protein spsF
sw-id:SPSG_BACSUswSPSG_BACSUP39627P339Bacillus subtilisSpore coat polysaccharide biosynthesis protein spsG
sw-id:SPSI_BACSUswSPSI_BACSUP39629P246Bacillus subtilisSpore coat polysaccharide biosynthesis protein spsI
sw-id:SPSJ_BACSUswSPSJ_BACSUP39630P315Bacillus subtilisSpore coat polysaccharide biosynthesis protein spsJ
sw-id:SPSK_BACSUswSPSK_BACSUP39631P283Bacillus subtilisSpore coat polysaccharide biosynthesis protein spsK
sw-id:SPSL_BACSUswSPSL_BACSUQ7WY56P151Bacillus subtilisSpore coat polysaccharide biosynthesis protein spsL

6. Повторить команду из предыдущего задания, используя разные опции изменения выдачи результата
infoseq sw:sps*_bacsu 0> anprotein0.txt anprotein0.txt (файл пуст, так и должно быть=)
infoseq sw:sps*_bacsu 1> anprotein1.txt anprotein1.txt
infoseq sw:sps*_bacsu 2> anprotein2.txt anprotein2.txt
8.(*) Найти у себя файл имя которого содержит "bash_history"
find ~ -name *bach_history* (~ означает, что ищем в домашней директории, а не там, где мы находимся. -name - ищем по имени)
нашелся файл /home/students/y11/marinakalina/.bash_history
почему ls не показывает этот файл?
С помощью команды man ls читаем опции команды ls. Находим параметр -a, с помощью которого мы НЕ игнорируем файлы, начинающиеся с точки. А наш файл как раз такой. Пробуем
marinakalina@kodomo:~$ ls -a
.
..
.bash_history
.bash_logout
.bashrc
следующие файлы..
Ура)
В этом файле содержится история употребляемых команд при работе в Putty
9.(*) Найти у себя файл с пробелом в имени.
marinakalina@kodomo:~$ find ~ -name "* *"
/home/students/y11/marinakalina/video/Sample Pictures.lnk
/home/students/y11/marinakalina/Term1/Block3/Practices/Practice 13
/home/students/y11/marinakalina/Application Data
Нашлось 3 файл с пробелом. их нужно переименовать. используем команду mv
marinakalina@kodomo:~$ mv "/home/students/y11/marinakalina/video/Sample Pictures.lnk" "/home/students/y11/marinakalina/video/SamplePictures.lnk"
marinakalina@kodomo:~$ mv "/home/students/y11/marinakalina/Term1/Block3/Practices/Practice 13" "/home/students/y11/marinakalina/Term1/Block3/Practices/Practice13"
marinakalina@kodomo:~$ mv "/home/students/y11/marinakalina/Application Data" "/home/students/y11/marinakalina/ApplicationData"

Bash


Потоки
stdin СТАНДАРТНЫЙ ПОТОК ВВОДА. Содержит то, что вы набираете на клавиатуре во время работы программы (например, в ответ на вопросы программы)
stdout СТАНДАРТНЫЙ ПОТОК ВЫВОДА и СТАНДАРТНЫЙ ПОТОК ОШИБОК, но по умолчанию их содержание отображается в консольном окне (потоки не разделены). Но если перенаправить stdout на stdin другой программы или в файл, можно разделить эти два потока. stderr же будет продолжать выводиться на экран.
stderr

Операторы перенаправления потоков
Символ > Для перенаправления стандартного вывода (stdout) команды в файл например, команда infoseq sw:SPSE_BUSCU > SPSE.info запишет в файл SPSE.info информацию из банка SwissProt (создаст его в текущей директории или перезапишет уже имеющийся файл с таким названнием).
сочетание символов >> дописать stdout команды в конец уже существующего файла например, команда infoseq sw:"SPS*_BACSU" >> SPSE.info дозапишет в конец файла информацию о всех найденных в банке белков комплекса SPSE в Bacillus Subtales.
USA Database Name Accession Type Length Organism
Description
sw-id:SPSE_BACSU sw SPSE_BACSU P39625 P 373 Bacillus subtilis Spore coat polysaccharide biosynthesis protein spsE
USA Database Name Accession Type Length Organism
Description
sw-id:SPSA_BACSU sw SPSA_BACSU P39621 P 256 Bacillus subtilis Spore coat polysaccharide biosynthesis protein spsA
sw-id:SPSB_BACSU sw SPSB_BACSU P39622 P 474 Bacillus subtilis Spore coat polysaccharide biosynthesis protein spsB
sw-id:SPSC_BACSU sw SPSC_BACSU P39623 P 389 Bacillus subtilis Spore coat polysaccharide biosynthesis protein spsC
sw-id:SPSD_BACSU sw SPSD_BACSU P39624 P 289 Bacillus subtilis Spore coat polysaccharide biosynthesis protein SpsD (2.3.1.-)
sw-id:SPSE_BACSU sw SPSE_BACSU P39625 P 373 Bacillus subtilis Spore coat polysaccharide biosynthesis protein spsE
sw-id:SPSF_BACSU sw SPSF_BACSU P39626 P 240 Bacillus subtilis Spore coat polysaccharide biosynthesis protein spsF
sw-id:SPSG_BACSU sw SPSG_BACSU P39627 P 339 Bacillus subtilis Spore coat polysaccharide biosynthesis protein spsG
sw-id:SPSI_BACSU sw SPSI_BACSU P39629 P 246 Bacillus subtilis Spore coat polysaccharide biosynthesis protein spsI
SPS*BACSU.info
сочетание символов 2> записать в файл stderr например, найдём файлы, содержащие выражение "bacsu" на диске P. Это делает команда find /P/ -name '*bacsu.*'. Команда выдает несколько результатов поиска и две ошибки. Чтобы разделить strout и strerr, используем указанные команды:
команда find /P/ -name '*fasta*' 1> 1.txt запишет в файл 1.txt результаты поиска (найденные файлы). 1.txt
команда find /P/ -name '*fasta*' 2> 2.txt запишет в файл 2.txt обнаруженные ошибки при поиске. 2.txt
Спецсимволы bash
Символ Значение Пример
Пробел и символ табуляции отделяют параметры друг от друга infoseq sw:spse_bacsu -only -name
" " Все символы внутри вопринимаются буквально, кроме $ и `. Эти символы сохраняют своё значение. Но если перед ними поставить \, то и они будут воприниматься буквально. mv "A gift.GIF" A_gift.GIF Без кавычек эта команда не выполнялась
Advanced (Unprompted) qualifiers:
' ' Внутри одиночных кавычек, любой специальный символ, за исключением ', интерпретируется как простой символ. Одиночные кавычки - более строгий вариант чем двойные кавычки less 'yes\no' символ \ - часть имени файла.
Маски поиска
* Некоторое множество символов (пустое в том числе) find ~ -name *.fasta команда будет искать в домашней директории файлы, имя которых оканчивается на peptid.txt
? Один символ find ~ -name ?.fasta На месте ? один символ
[0-9] цифра от 0 до 9. может быть и алфавит find ~ -name [0-9].fasta
Команда grep
Ищет в текстовом файле строки, содержащие некоторое выражение. Можно действовать этой командой на результат стандартного вывода, например infoseq "sw:*_bacsu" | grep chaperonin выводит на экран информацию обо всех белках вида Bacillus Subtilis, а затем среди полученных строчек ищет содержащие слово enzyme. Таким образом, можно выявить все белки-ферменты данного вида.
Команда различает некоторые спецсимволы: точка вместо любого символа, [0-9] цифра от 0 до 9, [аб] - буква "а" или "б", ^ - начало строки, $ - конец строки, \ - последующий символ воспринимается программой буквально


2. EMBOSS


Опции команды infoseq
Опция Действие Пример
Добавочные (опциональные) квалификаторы:
-outfile Если ввести сюда имя файла, программа запишет детали последовательности в файл. outinfo.txt
infoseq sw:spse_bacsu -outfile outinfo.txt
-html Результат в формате HTML-таблицы. htmlinfo.txt
infoseq sw:spse_bacsu -html 1> htmlinfo.txt
Квалификаторы:
-[no]columns Включите эту опцию(Y), чтобы получить информацию о последовательности в виде стройного, выровненного по колонкам файла выходных данных.Либо, отключите эту опцию (N), и в данном случае информация будет отделена символом, который можно задать с помощью опции -delimiter. nocolinfo.html
colinfo.txt
infoseq sw:spse_bacsu -nocolumns 1> nocolinfo.txt
infoseq sw:spse_bacsu -columns 1> colinfo.txt
-delimiter Используется для разделения разделов в выходном файле. Это может быть пробел, символ табуляции или любой другой символ. delinfo.txt
infoseq sw:spse_bacsu -nocolumns -delimiter "!" 1> delinfo.txt
-only Укорачивает выводимую информацию. Только -only: '-nohead -noname -noacc -notype -nopgc -nodesc' only.txt
infoseq sw:spse_bacsu -only -length 1> only.txt
-[no]heading Отображает названия колонок. head.txt
nohead.txt
infoseq sw:spse_bacsu -heading 1> head.txt
infoseq sw:spse_bacsu -noheading 1> nohead.txt
-usa Отображает "адрес последовательности в банке данных Uniform (Uniform Sequence Address). Употребляется только с -only. usa.txt
infoseq sw:spse_bacsu -only -usa 1> usa.txt
-database Отображает колонку 'database'. Употребляется только с -only. database.txt
infoseq sw:spse_bacsu -only -database 1> database.txt
-name Отображает колонку 'name'. Употребляется только с -only. name.txt
infoseq sw:spse_bacsu -only -name 1> name.txt
-accession Отображает колонку 'accession'.Употребляется только с -only. accession.txt
infoseq sw:spse_bacsu -only -accession 1> accession.txt
-gi Отображает колонку 'GI'. Употребляется только с -only. gi.txt
infoseq sw:spse_bacsu -only -gi 1> gi.txt
-seqversion Отображает колонку 'version'. Употребляется только с -only. vers.txt
infoseq sw:spse_bacsu -only -seqversion 1> vers.txt
-type Отображает колонку 'type'. Употребляется только с -only. type.txt
infoseq sw:spse_bacsu -only -type 1> type.txt
-length Отображает колонку 'length'. Употребляется только с -only. length.txt
infoseq sw:spse_bacsu -only -length 1> length.txt
-pgc Отображает процентное содержание rуанина и цитозина. Употребляется только с -only. pgc.txt
infoseq sw:spse_bacsu -only -pgc 1> pgc.txt
-organism Отображает колонку 'organism'. Употребляется только с -only organism.txt
infoseq sw:spse_bacsu -only -organism 1> organism.txt
-description Отображает колонку 'description'. Употребляется только с -only. description.txt
infoseq sw:spse_bacsu -only -description 1> description.txt
Главные квалификаторы:
-help Выводит информацию о команде infoseq help.txt
infoseq -help 2> help.txt