Рис. 1.Открытые рамки считывания, найденные программой ORF Finder.
Таблица 1.Рамки считывания, прошедшие фильтрацию по длине и перекрыванию.
Начало | Конец | Длина | Цепь | Функция |
270 | 1415 | 1146 | - | Рекомбиназа |
1709 | 1975 | 267 | + | гипотетический белок |
<1 | 151 | 150 | - | гипотетический белок |
Ниже приведены выравнивания, на основании которых было сделано заключение о функциях предполагаемых белков:
Идентификатор e-value Организм Длина белка Длина выравнивания Сходство WP_009257956.1 3e-140 Lachnospiraceae bacterium 378 382 71% Query 1 MPRKGENIYKRKDGRWEGRYIRDRV-NGKAKYGYVFAHSYKEVKIKLADAKARLASNTSA 59 MPRKGENIYKRKDGRWEGRYI+ R GKA YGYV+A +Y+EVK KL + + +++T+A Sbjct 1 MPRKGENIYKRKDGRWEGRYIKSRTPAGKANYGYVYAKTYREVKSKLVNQISFASNSTTA 60 Query 60 EPVIASELLICSFSRASDEWIQANKSQWKESSTMKYINILNNHLLPEFGQKNITDIARTD 119 + + +C F + EW Q Q KESS+ KY N+LN+++LP FG K + DI Sbjct 61 NQKVPT---VC-FECIAMEWFQTIHPQIKESSSNKYWNLLNSYVLPAFGLKPLCDITHDF 116 Query 120 IQAYISKLLTSSGRNNAGLAPKTVNSIISVMKNIFEYAAETKQCQLISFKGLNVKQPQKQ 179 I+ + LT G GL+ KTV+ I+S+++NI ++AA+ + + + +K+ + Sbjct 117 IEEQCNLFLTEGGLKGNGLSAKTVSDILSLIRNIMQFAAKKGNIISCNAQSIQIKRQIPE 176 Query 180 MRILSQAEQSLLTEYLLEESSNTGIGILLSLYTGLRVGEVCALKWEDISFRDRYIHVHKT 239 MR+LS+AEQ L +YL + IGIL+ L+TGLRVGE+CAL+WEDISF D IHVH+T Sbjct 177 MRVLSRAEQEKLCQYLYSDLDACNIGILVCLFTGLRVGEICALRWEDISFSDHTIHVHQT 236 Query 240 MQRIQVKGNSDHKSEIIISAPKSACSVRDVPVPDKLLLMLQERQKAPNTYFLTGKTALYV 299 +QRIQ + NS K++I+I+APKSACS+R +PVP+ L+++L + + Y LT + Sbjct 237 LQRIQNRANSKQKTKIVITAPKSACSIRTIPVPNDLIVILASYKTSSKGYILTNCEQTPL 296 Query 300 EPRTMQNRFKSTIKKAGIAPANFHALRHTFATRCIELGFDIKSLSEILGHASVNITLNRY 359 EPRTMQN FK ++K+GIAPAN+H+LRHTFATRCIELGFD+KSLSEILGHASVNIT+NRY Sbjct 297 EPRTMQNHFKRALQKSGIAPANYHSLRHTFATRCIELGFDVKSLSEILGHASVNITMNRY 356 Query 360 VHPSMELKQKNMNMLYDLLAVK 381 VHP+MELKQ+NM L LLAVK Sbjct 357 VHPTMELKQENMQRLSALLAVK 378 Идентификатор e-value Организм Длина белка Длина выравнивания Сходство WP_035776160.1 4e-20 Butyrivibrio sp. 90 83 69% Query 4 KSEIIEILRTELPVLRAKARISQEDIAEKIGISRQTYSSIETGKRTASWTTILALIAYFQ 63 + ++I+IL ELPVLRAK +SQE++++ IG+SRQTYSSIET KR +W T L+LI +F Sbjct 2 RDKLIDILSEELPVLRAKIGLSQEELSDIIGVSRQTYSSIETKKRRMTWGTFLSLILFFD 61 Query 64 NNEDTAQMIDEIPGLKKKLAMVL 86 NNE T+ M+ I L +L Sbjct 62 NNEKTSPMLQNIGAFPDSLKNLL 84 Идентификатор e-value Организм Длина белка Длина выравнивания Сходство WP_016221950.1 2e-14 Dorea sp. 157 56 78% Query 1 MQIMNKDDYKNVPISALEFSTRTFNALMRANIDTLYLLIEHSAALQDVSNLGTKSL 56 M I N+++Y +PISAL FSTRTFN L RANI TLYLLIE+ L+++ N+G+KS+ Sbjct 1 MYIKNREEYCKIPISALNFSTRTFNCLKRANISTLYLLIENIENLEEIRNMGSKSI 56
Ниже приведены предсказания, полученные с помощью GeneMark:
Predicted genes
Gene Strand LeftEnd RightEnd Gene Class
# Length
1 - <2 94 93 1
2 - 270 1415 1146 1
3 + 1709 1975 267 1
4 + 2037 >2207 171 1
Рис. 2.График кодирующего потенциала.
Рис. 3.График кодирующего потенциала.
Красным в выдачах программ выделены рамки считывания, совпадающие с генами. В графиках кодирующего потенциала видно, что чем больше потенциал, тем больше вероятность того, что данная рамка считывания окажется именно геном.
Таблица 2.Выдача программы GENEMARK. Зеленым выделены полностью правильные предсказания, красным - полностью неправильные предсказания. Частичных предсказаний нет.
Ген |
Цепь |
Начало |
Конец |
Длина гена |
1 |
- |
<2 |
94 |
93 |
2 |
- |
270 |
1415 |
1146 |
3 |
+ |
1709 |
1975 |
267 |
4 |
+ |
2037 |
>2207 |
171 |
Вывод: программа предсказания генов Genemark предсказывает гены с довольно большой (около 75%) вероятностью.
Дата последнего обновления: 16.02.2015