Белок в Uniprot

Программа infoseq пакета EMBOSS

USA Database Name Accession Type Length Organism Description
sw-id:PDUO_BACSU sw PDUO_BACSU O34899 P 193 Bacillus subtilis a,c-diamide adenosyltransferase (2.5.1.17)

Введя в консоли команду infoeq -help >> infoseqhelp.txt я получил следующий файл:
описание команды infoseq
Поскольку я не нашел мой белок в других бактериях рода Bacillus, для выполнения задания я взял для примера белок RS3_BAC*, и, введя в консоль infoseq sw:RS3_BAC* >> RS3.txt
Я получил файл Белок RS3 у бактерий рода Bacillus
Я изучил различные опции команды indoseq, и вот примеры: так как мой белок встречается только у одной бактерии рода Bacillus, для примера я использовал белок RS3
При вводе в консоль infoseq sw:RS3_BAC* -only -name я получил список названий бактерий, у которых есть данный белок , вот файл с результатами поиска -only -name
команда значение пример
-outfile при написании здесь имени файла, программа запишет детали последовательности в этот файл infoseq sw:"PDUO_BAC*" -outfile bacillus.txt
-html выводит данные в виде таблици HTML infoseq sw:"PDUO_BAC*" -html bacillus.html
-delimeter Эта строка используется для разделения отдельной записи в выходной текстовый файл. Это может быть пробел, табуляция, или любой другой символ или строка. (Любая строка) infoseq sw:"PDUO_BAC*" -delimiter "|" >> bacillus.txt
-only Для сокращения командной строки вместо написания: -nohead -noname -noacc -notype -nopgc -nodesc если необходимо вывести только длину, можно написать -only -length infoseq sw:"PDUO_BAC*" -only -length bacillus.txt
-database -name -accession -gi - seqversion -type -length -pgc -organism -description -database показывает колонку 'database' -name показывает колонку 'name' -accession показывает колонку 'accession' -gi показывает колонку 'GI' -seqversion показывает колонку 'version' -type показывает колонку 'type' -length показывает колонку 'length' -pgc показывает колонку 'percent GC conten' -organism показывает колонку 'organism' -description показывает колонку 'description' infoseq sw:"PDUO_BAC*" -gi -length bacillus.txt

bash

усовершенствованная и модернизированная вариация командной оболочки Bourne shell.
Одна из наиболее популярных современных разновидностей командной оболочки UNIX.
поддерживается сервером kodomo

Некоторые команды

pwd сообщает полное имя текущей директории
ls показывает содержимое текущей директории
cp <имя файла 1> <имя файла 2> копирует файл 1 в файл 2
mv <имя файла 1> <имя файла 2> переименовывает файл
mv <имя файла> <имя поддиректории> перемещает файл в поддиректорию
rm <имя файла> уничтожает файл
mkdir <имя поддиректории> создает поддиректорию
cd <имя поддиректории> переход в поддиректорию
cd .. выход из поддиректории (переход в родительскую директорию)
more <имя файла> просмотр содержимого файла (клавишами "пробел" и "Enter")
man <команда> выдает подробную информацию о команде


Каждое приложение в терминале работает с тремя потоками данных:
- stdin - стандартный поток ввода, содержит то, что пользователь набирает в командной строке
- stdout - стандартный поток вывода данных, содержит ответы программ на запросы пользователя, по умолчанию выводится на консоль
- stderr - стандартный поток ошибок, по умолчанию выводится на консоль

Как сказано выше, на консоль по умолчанию выводятся потоке stdout и stderr. Вывод потока stdout в можно направить в файл, для этого служат
операторы > и >>, но оператор > стирает все что было в файле, если там что-то было, и перезаписывает информацию, а оператор >> добавляет информацию в конец существующего файла, или создает ноый с данным именем
Например, если ввести в консоль команду ls >> ls.txt , то содержимое рабочей директории будет выведено в файле ls.txt
Для вывода в файл потока stderr служит оператор 2>, работающий абсолютно аналогично оператору >> для stdout
Для направления stdout одной команды на stdin другой команды используется оператор pipe, задаваемый знаком | . Например, команда
ls | rm стирает все содержимое рабочей директории.

спецсимволы bash


Некоторые символы распознаются bash не буквально, а как некоторые операторы, так:
- пробел и табуляция разделяют команды
- простые кавычки, обрамляющие текст, заставляют воспринимать bash все буквально, например, команда 'rm -rf' не сотрет все данные пользователя, а лишь выдаст такую запись в stdin
- значение символа ; аналогично значению его на языке C, то есть он разделяет строки, так, введя в консоль ls; pwd, поток stdout выдаст сначала содержимое рабочей директории, а затем полное имя директории.
- Звездочка * и квадратные скобки [ ] используются для "масок" имен файлов. Например [0-9]* bash превращает в список всех файлов текущей директории, чье название начинается с цифры.

дополнительно о bash



В главной директории ввожу команду find -name "*bash_history*" и получаю ответ ./.bash_hystory
команда ls выводит не все файлы, я пользуюсь оконным менеджером WinSCP, и он показывает множество файлов, начинающихся с точки, не выдаваемых командой ls
Введя команду man ls, я получил следующую строчку "-a, --all do not ignore entries starting with .", что значит что по умолчанию ls не показывает файлы, начинающиеся с точки
, но команда ls -a показала все файлы в моей директории

с помощью команды find "* *" находим все файлы с пробелом в имени, у меня таких не оказалось, поискав у однокурсников, я тоже ничего не нашел, и поэтому в корневой
директории создал файл file with.space, который переименовал командой mv "file with.space" filewithout.space