Emboss


Об infoseq

infoseq - это консольная программа биоинформатического пакета EMBOSS (European Molecular Biology Open Software Suite). Она помогает найти информацию о последовательности белков и сиквенсах, в базах даных, потключенных к EMBOSS, с помощью команды showdb.

Основные команды infoseq

НазваниеОписаниеПример
-outfileВыдает информацию о последовательности в этом файле по его названиюinfoseq -outfile outfile.txt sw:uvrb_bacsu
-htmlВыдает данные в html таблице, которую можно передать в файлinfoseq -html sw:uvrb_bacsu > outfile.html
-[no]columnscolumns выдает данные в виде выровненных колонок, nocolumns же разграничивает колонки символом |.
Этот символ можно сменить с помощью параметра -delimiter
infoseq -nocolumns -delimiter |||||
sw:uvrb_bacsu
-onlyПозволяет укоротить командную строку. Например, чтобы узнать только название
последовательности, вместо -nolength -noac -nodatabase -nousa -noorganism -notype -nodescription
достаточно ввести лишь -only -name
infoseq -only -name
sw:uvrb_bacsu
-[no]headingПоказывает или убирает названия колонок с информацией. По умолчнию установлен
параметр -heading, то есть столбцы озаглавлены.
infoseq -noheading sw:uvrb_bacsu
-usaПоказывает Единый Адрес Последовательности (Uniform Sequence Address). Применяется с -only.infoseq -noheading sw:uvrb_bacsu
-databaseПоказывает название базы данных, к которой хранится данная последовательность. Применяется с -only.infoseq -only -database sw:uvrb_bacsu > database.txt
-nameПоказывает название последовательности. Применяется с -only.infoseq -only -name sw:uvrb_bacsu
-acПоказывает индивидуальный номер последовательности (accession number). Применяется с -only.infoseq -ac -name sw:uvrb_bacsu
-descriptionПоказывает краткое описание последовательности. Применяется с -only.infoseq -only -description sw:uvrb_bacsu
-organismПоказывает название организма, которому принадлежит последовательность. Применяется с -only.infoseq -only -organism sw:uvrb_bacsu
-lengthПоказывает длину последовательности (количество аминокислот для полипептида или пар нуклеотидов для НК). Применяется с -only.infoseq -only -length sw:uvrb_bacsu
-typeПоказывает тип последовательности (полипептид или НК). Применяется с -only.infoseq -only -type sw:uvrb_bacsu
-seqversionПоказывает версию последовательности. Применяется с -only.infoseq -only -seqversion sw:uvrb_bacsu
-giПоказывает GI номер. Этот номер присваивается последовательностям из баз данных, относящихся к NCBI (национальному центру биотехнологической информации США). Применяется с -only.infoseq -only -gi sw:uvrb_bacsu
-pgcПоказывает процентное содержание пар GC. Применяется с -only.infoseq -only -pgc sw:uvrb_bacsu
-helpПоказывает информацию о параматрах программы infoseq.infoseq -help

Bash