EMBOSS

Программа getorf пакета EMBOSS

C помощью команды entret embl:D89965 получаем файл (ССЫЛКА) с записью, из которой узнаём, что это последовательность матричной РНК, полученная в эксперименте из желудка крысы Rattus norvegicus.
Используя для d89965.entret интересующую нас команду getorf -minsize 30 -table 0 -find 1 получаем набор всех рамок считывания (считая рамкой последовательность между старт и стоп кодонами) длиной более 30 нуклеотидов. При таком варианте записи получаем рамки в транслированном виде, используется стандартные генетический код. Получено всего 9 рамок различной длины. Из них пятая совпадает с той последовательностью, что приведена в записи EMBL для белка. В свою очередь запись EMBL ссылается на запись Swiss-Prot с идентификатором P0A7B8 (ССЫЛКА). Эта запись соответствует белку HSLV_ECOLI из кишечной палочки. Приведённая в записи последовательность соотносится при этом с девятой из найденных рамок считывания.

Как можно объяснить наблюдаемую ситуацию?
Можно предположить следующее: во время эксперимента была сиквенирована последовательность бактериального гена, а такое вполне возможно, так как E.coli населяет различные участки кишечного тракта. Затем (например, по сходству последовательности одной из рамок считывания) было предположено, что это именно такой крысиный ген. Как известно, EMBL - база архивная, в которой за достоверность информации отвечает только тот, кто её туда поместил. В то же время Swiss-Prot база реферируемая, а потому данным из неё можно доверять значительно больше. Таким образом, наблюдаем ошибку интерпретации результатов сиквенирования (по неверной ORF).

Файлы-списки

EnsEMBL

EnsEMBL - геномный браузер, позволяющий визуализировать информацию о геномах человека и животных (в основном позвоночных).

Дата последнего обновления: 09.12.2013
© Dmitry Travin, 2013