Поиск организма по фрагменту нуклеотидной последовательности
С помощью команды
entret embl:d89965
получим файл с записью D89965 банка EMBL.
Эта запись содержит последовательность мРНК из желудка Rattus norvegicus.
Затем с помощью команды
getorf -minsize 30 -table 0 -find 1 d89965.entret
в Putty был получен
список открытых рамок считывания данной последовательности,
начинающихся со старт-кодона, заканчивающихся стоп-кодоном и длинной не менее 30 нуклеотидов.
5-ая по счету рамка полностью соответсвует CDS записи.
Данная запись (D89965) ссылается на запись P0A7B8 в SwissProt. Чтобы получить ее запись воспользуемся командой
entret sw:P0A7B8.
Полученная запись, как оказалось, соответствует гену E. coli (HSLV_BACSU) и также совпадает с рамкой считывания.
Единственным объяснением этому может служить то, что секвенировании последовательностей R. norvegicus была допущена ошибка (E. coli обитает в пищевариетлном тракте млекопитающих и, очевидно, могла попасть в желудок).
А поскольку банк EMBL - архивный, в нем сохраняются все результаты, а в SwissProt - только проверенные. Поэтому EMBL, мог сохранить ошибочные данные, отсылаясь на их исправленный вариант в другой базе данных.
Файлы-списки
Далее в списке будут команды, нажав на которые можно просмотреть файлы, которые получены соответствующими командами, а также краткое описание полученных файлов: