Infoseq-консольная программа из пакета EMBOSS для поиска информации о белках и сиквенсах.
Синтаксис команды: infoseq [сокращенное название базы данных]:[идентификатор последовательности]. Так, для моего белка PTHP запрос выглядит:infoseq sw:pthp_bacsu, где sw- сокращенное название базы данных SwissProt, pthp_bacsu - идентификатор последовательности.
С помощью команды infoseq -html sw:pthp_bacsu > [путь к файлу] запишем полную информацию о последовательности pthp_bacsu в html-файл.
USA(Uniform Sequence Address)- полный адрес последовательности, Database- название базы данных, Name-название последовательности, Accession number- идентификатор последовательности, type- тип последовательности, length- длина, organism- организм из которого она была получена, description- краткое описание последовательности.

USADatabaseNameAccessionTypeLengthOrganismDescription
sw-id:PTHP_BACSUswPTHP_BACSUP08877P88Bacillus subtilis (strain 168)Phosphocarrier protein HPr (2.7.11.-) (Histidine-containing protein)

Запишем в html-файл только 4 колонки, для этого используем infoseq -only -name -accession -length -description -html sw:pthp_bacsu > [путь к файлу]

NameAccessionLengthDescription
PTHP_BACSUP0887788Phosphocarrier protein HPr (2.7.11.-) (Histidine-containing protein)

Также с помощью команды infoseq -only -name -html sw:pthp_bacsu > [путь к файлу]

запишем только одну колонку с названием последовательности.

Name
PTHP_BACSU

Описание параметров программы Infoseq

Параметр Значение по умолчанию Описание
-html N вывод в виде HTML
-only N вывод только указанных позиций
-outfile stdout вывод данных на экран или в файл
-columns Y вывод колонкамиL
-help вывод справки
-delimiter | вывод разделителя
-heading Y вывод заголовков таблицыL
-length Y вывод длины последовательности
-description Y вывод краткого описания последовательности
-name Y вывод названия белка
-organism Y вывод названия организма
-ac Y вывод кода доступа

© Boskhomdzhieva Baina, 2012