
Рис. 1.Открытые рамки считывания, найденные программой ORF Finder.
Таблица 1.Рамки считывания, прошедшие фильтрацию по длине и перекрыванию.
| Начало | Конец | Длина | Цепь | Функция |
| 270 | 1415 | 1146 | - | Рекомбиназа |
| 1709 | 1975 | 267 | + | гипотетический белок |
| <1 | 151 | 150 | - | гипотетический белок |
Ниже приведены выравнивания, на основании которых было сделано заключение о функциях предполагаемых белков:
Идентификатор e-value Организм Длина белка Длина выравнивания Сходство
WP_009257956.1 3e-140 Lachnospiraceae bacterium 378 382 71%
Query 1 MPRKGENIYKRKDGRWEGRYIRDRV-NGKAKYGYVFAHSYKEVKIKLADAKARLASNTSA 59
MPRKGENIYKRKDGRWEGRYI+ R GKA YGYV+A +Y+EVK KL + + +++T+A
Sbjct 1 MPRKGENIYKRKDGRWEGRYIKSRTPAGKANYGYVYAKTYREVKSKLVNQISFASNSTTA 60
Query 60 EPVIASELLICSFSRASDEWIQANKSQWKESSTMKYINILNNHLLPEFGQKNITDIARTD 119
+ + +C F + EW Q Q KESS+ KY N+LN+++LP FG K + DI
Sbjct 61 NQKVPT---VC-FECIAMEWFQTIHPQIKESSSNKYWNLLNSYVLPAFGLKPLCDITHDF 116
Query 120 IQAYISKLLTSSGRNNAGLAPKTVNSIISVMKNIFEYAAETKQCQLISFKGLNVKQPQKQ 179
I+ + LT G GL+ KTV+ I+S+++NI ++AA+ + + + +K+ +
Sbjct 117 IEEQCNLFLTEGGLKGNGLSAKTVSDILSLIRNIMQFAAKKGNIISCNAQSIQIKRQIPE 176
Query 180 MRILSQAEQSLLTEYLLEESSNTGIGILLSLYTGLRVGEVCALKWEDISFRDRYIHVHKT 239
MR+LS+AEQ L +YL + IGIL+ L+TGLRVGE+CAL+WEDISF D IHVH+T
Sbjct 177 MRVLSRAEQEKLCQYLYSDLDACNIGILVCLFTGLRVGEICALRWEDISFSDHTIHVHQT 236
Query 240 MQRIQVKGNSDHKSEIIISAPKSACSVRDVPVPDKLLLMLQERQKAPNTYFLTGKTALYV 299
+QRIQ + NS K++I+I+APKSACS+R +PVP+ L+++L + + Y LT +
Sbjct 237 LQRIQNRANSKQKTKIVITAPKSACSIRTIPVPNDLIVILASYKTSSKGYILTNCEQTPL 296
Query 300 EPRTMQNRFKSTIKKAGIAPANFHALRHTFATRCIELGFDIKSLSEILGHASVNITLNRY 359
EPRTMQN FK ++K+GIAPAN+H+LRHTFATRCIELGFD+KSLSEILGHASVNIT+NRY
Sbjct 297 EPRTMQNHFKRALQKSGIAPANYHSLRHTFATRCIELGFDVKSLSEILGHASVNITMNRY 356
Query 360 VHPSMELKQKNMNMLYDLLAVK 381
VHP+MELKQ+NM L LLAVK
Sbjct 357 VHPTMELKQENMQRLSALLAVK 378
Идентификатор e-value Организм Длина белка Длина выравнивания Сходство
WP_035776160.1 4e-20 Butyrivibrio sp. 90 83 69%
Query 4 KSEIIEILRTELPVLRAKARISQEDIAEKIGISRQTYSSIETGKRTASWTTILALIAYFQ 63
+ ++I+IL ELPVLRAK +SQE++++ IG+SRQTYSSIET KR +W T L+LI +F
Sbjct 2 RDKLIDILSEELPVLRAKIGLSQEELSDIIGVSRQTYSSIETKKRRMTWGTFLSLILFFD 61
Query 64 NNEDTAQMIDEIPGLKKKLAMVL 86
NNE T+ M+ I L +L
Sbjct 62 NNEKTSPMLQNIGAFPDSLKNLL 84
Идентификатор e-value Организм Длина белка Длина выравнивания Сходство
WP_016221950.1 2e-14 Dorea sp. 157 56 78%
Query 1 MQIMNKDDYKNVPISALEFSTRTFNALMRANIDTLYLLIEHSAALQDVSNLGTKSL 56
M I N+++Y +PISAL FSTRTFN L RANI TLYLLIE+ L+++ N+G+KS+
Sbjct 1 MYIKNREEYCKIPISALNFSTRTFNCLKRANISTLYLLIENIENLEEIRNMGSKSI 56
Ниже приведены предсказания, полученные с помощью GeneMark:
Predicted genes
Gene Strand LeftEnd RightEnd Gene Class
# Length
1 - <2 94 93 1
2 - 270 1415 1146 1
3 + 1709 1975 267 1
4 + 2037 >2207 171 1

Рис. 2.График кодирующего потенциала.

Рис. 3.График кодирующего потенциала.
Красным в выдачах программ выделены рамки считывания, совпадающие с генами. В графиках кодирующего потенциала видно, что чем больше потенциал, тем больше вероятность того, что данная рамка считывания окажется именно геном.
Таблица 2.Выдача программы GENEMARK. Зеленым выделены полностью правильные предсказания, красным - полностью неправильные предсказания. Частичных предсказаний нет.
|
Ген |
Цепь |
Начало |
Конец |
Длина гена |
|
1 |
- |
<2 |
94 |
93 |
|
2 |
- |
270 |
1415 |
1146 |
|
3 |
+ |
1709 |
1975 |
267 |
|
4 |
+ |
2037 |
>2207 |
171 |
Вывод: программа предсказания генов Genemark предсказывает гены с довольно большой (около 75%) вероятностью.
Дата последнего обновления: 16.02.2015