EMBOSS


Программа getorf пакета EMBOSS

Файл с записью был получен с помощью команды entret embl:d89965.

getorf -minsize 90 -table 0 -find 1 d89965.entret
Таким образом получим список открытых рамок считывания данной последовательности, которые начинаются со старт-кодона, заканчиваются стоп-кодоном, и длина которых не меньше 90 нуклеотидов (30 аминокислот).

Как видно из этих двух файлов, 5-ая по счету рамка (>D89965_5 [163 - 432] Rattus norvegicus mRNA for RSS, complete cds) полностью перекрывает CDS записи.

Запись D89965 ссылается на запись P0A7B8 в SwissProt. Получим соответствующую запись с помощью команды
entret sw:P0A7B8
Полученная запись соответствует гену E. coli (HSLV_BACSU) и совпадает с рамкой считывания.

Видимо, ошибка была допущена при сиквенировании последовательностей крысы. Так как E. coli обитает в пищевариетлном тракте млекопитающих, то она вполне могла попасть и в желудок животного. Так как в банке EMBL сохраняются все результаты, а в SwissProt - только проверенные, в EMBL могу содержаться ошибочные данные, ссылаясь на их исправленный вариант в другой базе данных.

Файлы-списки

Далее в списке будут команды, нажав на которые можно просмотреть файлы, которые получен соответствующими командами, а также краткое описание полученных файлов:

EnsEMBL

MTPN_HUMAN, Myotrophin (Protein V-1) - белок с которым велась работа в "Онлай BLAST". Скрин с основной информацией о нем из EnsEMBL.


Далее с помощью функции EXPORT данного сервиса была получена
полная последовательность.

C помощью установленной на EnsEMBL программы BLAST/BLAT можно провести соответствующий поиск по геному человека (в кариотипе):

Пройдя по ссылке Contig view рассмотрим Region in detail.


На картинке выше - детальное описания участка генома в области гена. Есть информация о разметке ДНК в мегабазах, контиги и закодировавнные гены. РНК гены выделены фиолетовымвыделены, псевдогены - серым цветом, транскрипт - синим, а участки, определенные как EnsEMBL так и Havana - желтым.