EMBOSS

Программа getorf пакета EMBOSS

Программа getorf находит ORF в заданной последовательности. Командой
 getorf -minsize 30 -table 0 -find 1 d89965.entret
была запущена программа с параметрами, требуемыми чтобы найденные ORF обладали желаемыми свойствами (длина > 29 а.о. и начинались старт-кодоном, а заканчивались стоп-кодоном).

CDS заданной последовательности: 163-435. Из найденных рамок считывания такие координаты соответствуют пятой. Swissprot AC: P0A7B8. Swissprot относит этот белок к E. coli. Видимо, архивный nr просто содержит устаревшие сведения, а кусочек генома E. coli подвергся секвенированию вместе с геномом крысы по случайности (из кишечника той же крысы, возможно).

Файлы-списки

Для получения списка последовательностей одного заданного белка нескольких вполне конкретных организмов были использованы следующие команды:

 seqret sw:adh*_*
 infoseq -only -usa adh.fasta | grep -f list > list2
 seqret @list2 list3.fasta
 

EnsEMBL

Для гена LCK:

Рис. Первичная последовательность

Рис. Информация о структуре гена, вариантах сплайсинга и экзонах

Рис. Данные о белке, входящих в него доменах, и физических характеристках (изоэлектрическая точка и др.)
Вот что BLAT сделал с одним из маленьких экзонов LCK:

Рис. BLAT. Можно зато сделать вывод о локусе экзона (чисто визуально). Последовательность экзона оказалось довольно-таки уникальной: похожа только на саму себя.
Contig view дает довольно точно представление о локусе и о контексте искомого фрагмента в довольно-таки широких диапозонах.

© Ляпунов Александр, 2012. 2012.       Дата последнего изменения: 11.05.2013