Файл с записью был получен с помощью команды entret embl:d89965.
getorf -minsize 90 -table 0 -find 1 d89965.entret
Таким образом получим список открытых рамок считывания данной последовательности, которые начинаются со старт-кодона,
заканчиваются стоп-кодоном, и длина которых не меньше 90 нуклеотидов (30 аминокислот).
Как видно из этих двух файлов, 5-ая по счету рамка (>D89965_5 [163 - 432] Rattus norvegicus mRNA for RSS, complete cds) полностью перекрывает CDS записи.
Запись D89965 ссылается на запись P0A7B8 в SwissProt. Получим соответствующую запись с помощью команды
entret sw:P0A7B8
Полученная запись соответствует гену E. coli (HSLV_BACSU) и совпадает с рамкой считывания.
Видимо, ошибка была допущена при сиквенировании последовательностей крысы. Так как E. coli обитает в пищевариетлном тракте млекопитающих,
то она вполне могла попасть и в желудок животного. Так как в банке EMBL сохраняются все результаты, а в SwissProt - только проверенные,
в EMBL могу содержаться ошибочные данные, ссылаясь на их исправленный вариант в другой базе данных.
Далее в списке будут команды, нажав на которые можно просмотреть файлы, которые получен соответствующими командами, а также краткое описание полученных файлов:
MTPN_HUMAN, Myotrophin (Protein V-1) - белок с которым велась работа в "Онлай BLAST". Скрин с основной информацией о нем из EnsEMBL.