Учебный сайт Дюгая Ильи

Главная

Первый семестр

Второй семестр

Ссылки

Об авторе

ORF Finder

Рис. 1.Открытые рамки считывания, найденные программой ORF Finder.

Таблица 1.Рамки считывания, прошедшие фильтрацию по длине и перекрыванию.

Начало Конец Длина Цепь Функция
270 1415 1146 - Рекомбиназа
1709 1975 267 + гипотетический белок
<1 151 150 - гипотетический белок

Ниже приведены выравнивания, на основании которых было сделано заключение о функциях предполагаемых белков:


Идентификатор	e-value	Организм	            	Длина белка	Длина выравнивания	Сходство
WP_009257956.1 	3e-140  Lachnospiraceae bacterium 	378	        382	                71%
Query  1    MPRKGENIYKRKDGRWEGRYIRDRV-NGKAKYGYVFAHSYKEVKIKLADAKARLASNTSA  59
            MPRKGENIYKRKDGRWEGRYI+ R   GKA YGYV+A +Y+EVK KL +  +  +++T+A
Sbjct  1    MPRKGENIYKRKDGRWEGRYIKSRTPAGKANYGYVYAKTYREVKSKLVNQISFASNSTTA  60

Query  60   EPVIASELLICSFSRASDEWIQANKSQWKESSTMKYINILNNHLLPEFGQKNITDIARTD  119
               + +   +C F   + EW Q    Q KESS+ KY N+LN+++LP FG K + DI    
Sbjct  61   NQKVPT---VC-FECIAMEWFQTIHPQIKESSSNKYWNLLNSYVLPAFGLKPLCDITHDF  116

Query  120  IQAYISKLLTSSGRNNAGLAPKTVNSIISVMKNIFEYAAETKQCQLISFKGLNVKQPQKQ  179
            I+   +  LT  G    GL+ KTV+ I+S+++NI ++AA+       + + + +K+   +
Sbjct  117  IEEQCNLFLTEGGLKGNGLSAKTVSDILSLIRNIMQFAAKKGNIISCNAQSIQIKRQIPE  176

Query  180  MRILSQAEQSLLTEYLLEESSNTGIGILLSLYTGLRVGEVCALKWEDISFRDRYIHVHKT  239
            MR+LS+AEQ  L +YL  +     IGIL+ L+TGLRVGE+CAL+WEDISF D  IHVH+T
Sbjct  177  MRVLSRAEQEKLCQYLYSDLDACNIGILVCLFTGLRVGEICALRWEDISFSDHTIHVHQT  236

Query  240  MQRIQVKGNSDHKSEIIISAPKSACSVRDVPVPDKLLLMLQERQKAPNTYFLTGKTALYV  299
            +QRIQ + NS  K++I+I+APKSACS+R +PVP+ L+++L   + +   Y LT      +
Sbjct  237  LQRIQNRANSKQKTKIVITAPKSACSIRTIPVPNDLIVILASYKTSSKGYILTNCEQTPL  296

Query  300  EPRTMQNRFKSTIKKAGIAPANFHALRHTFATRCIELGFDIKSLSEILGHASVNITLNRY  359
            EPRTMQN FK  ++K+GIAPAN+H+LRHTFATRCIELGFD+KSLSEILGHASVNIT+NRY
Sbjct  297  EPRTMQNHFKRALQKSGIAPANYHSLRHTFATRCIELGFDVKSLSEILGHASVNITMNRY  356

Query  360  VHPSMELKQKNMNMLYDLLAVK  381
            VHP+MELKQ+NM  L  LLAVK
Sbjct  357  VHPTMELKQENMQRLSALLAVK  378



Идентификатор	e-value	Организм	        Длина белка	Длина выравнивания	Сходство
WP_035776160.1	4e-20	Butyrivibrio sp.	90	        83	            	69%
Query  4   KSEIIEILRTELPVLRAKARISQEDIAEKIGISRQTYSSIETGKRTASWTTILALIAYFQ  63
           + ++I+IL  ELPVLRAK  +SQE++++ IG+SRQTYSSIET KR  +W T L+LI +F 
Sbjct  2   RDKLIDILSEELPVLRAKIGLSQEELSDIIGVSRQTYSSIETKKRRMTWGTFLSLILFFD  61

Query  64  NNEDTAQMIDEIPGLKKKLAMVL  86
           NNE T+ M+  I      L  +L
Sbjct  62  NNEKTSPMLQNIGAFPDSLKNLL  84





Идентификатор	e-value	Организм	Длина белка	Длина выравнивания	Сходство
WP_016221950.1	2e-14	Dorea sp.	157	        56	            	78%
Query  1   MQIMNKDDYKNVPISALEFSTRTFNALMRANIDTLYLLIEHSAALQDVSNLGTKSL  56
           M I N+++Y  +PISAL FSTRTFN L RANI TLYLLIE+   L+++ N+G+KS+
Sbjct  1   MYIKNREEYCKIPISALNFSTRTFNCLKRANISTLYLLIENIENLEEIRNMGSKSI  56

GeneMark

Ниже приведены предсказания, полученные с помощью GeneMark:

Predicted genes
   Gene    Strand    LeftEnd    RightEnd       Gene     Class
    #                                         Length
    1        -          <2          94           93        1
    2        -         270        1415         1146        1
    3        +        1709        1975          267        1
    4        +        2037       >2207          171        1

Рис. 2.График кодирующего потенциала.

Рис. 3.График кодирующего потенциала.

Красным в выдачах программ выделены рамки считывания, совпадающие с генами. В графиках кодирующего потенциала видно, что чем больше потенциал, тем больше вероятность того, что данная рамка считывания окажется именно геном.

Таблица 2.Выдача программы GENEMARK. Зеленым выделены полностью правильные предсказания, красным - полностью неправильные предсказания. Частичных предсказаний нет.

Ген

Цепь

Начало

Конец

Длина гена

1

-

<2

94

93

2

-

270

1415

1146

3

+

1709

1975

267

4

+

2037

>2207

171

Вывод: программа предсказания генов Genemark предсказывает гены с довольно большой (около 75%) вероятностью.

Дата последнего обновления: 16.02.2015
Copyright © Дюгай Илья, 2014.