
Рис. 1.Открытые рамки считывания, найденные программой ORF Finder.
Таблица 1.Рамки считывания, прошедшие фильтрацию по длине и перекрыванию.
| начало | конец | длина | цепь | функция |
| 1081 | 2526 | 1446 | - | Мембранный белок |
| 2594 | 2800 | 207 | - | Диоксигеназа |
| <1 | 848 | <848 | - | Енолаза |
Ниже приведены выравнивания, на основании которых было сделано заключение о функциях предполагаемых белков:
Идентификатор e-value Организм Длина белка Длина выравнивания Сходство
WP_006859970.1 0.0 Marvinbryantia formatexigens 468 473 79%
Query 10 MKKFMDEDFLLETETAKHLYHDYAEKMPIIDYHCHLSPKEIYEDQTYENITPVWLYGDHY 69
MK FMD+DFLL TETAK LYH+YAE MP++DYHCHL+P+EI ED+ +ENIT VWL GDHY
Sbjct 1 MKPFMDKDFLLSTETAKKLYHNYAEVMPVLDYHCHLNPQEIAEDKHFENITEVWLGGDHY 60
Query 70 KWRQMRSNGCDESLVIGTASDHDKFIAWAKTLQMAIGNPLYHWSHLELKRYFDFDGYLCE 129
KWRQMRSNG +E + G A +KF WA+TL+ IGNPLYHWSHLEL+RYF + G+LC
Sbjct 61 KWRQMRSNGVEEYYITGDAPAREKFQKWAETLEKLIGNPLYHWSHLELQRYFGYTGHLCA 120
Query 130 DNAEEVWNMTAEKL-QNGLSARKLIENSNVEVICTTDDPVDSLEWHKKIAEDDTFSVKVL 188
D AEEVWN+ EKL Q +SAR+LI+ S V ++CTTDDPVDSLEWH+KI D+TF V+VL
Sbjct 121 DTAEEVWNLCNEKLAQPDMSARELIKRSGVTLVCTTDDPVDSLEWHEKIKADETFDVQVL 180
Query 189 PAWRPDQATNIEAEGFVSYVKKLEEVSGVSIESFDDLVAALSNRMDFFAENGCSVSDHGI 248
PAWRPD+A+ IE F YV KL EVSG+ ++SF DL A+ NRM++F E GCSVSDHG+
Sbjct 181 PAWRPDKASGIEKPAFPDYVAKLSEVSGIPVKSFADLKKAIVNRMEYFNERGCSVSDHGL 240
Query 249 AYMMYAPASAEEVDAVFKKRLAAGTVSGQEAGLTAQEINEYKTALLVALGRMYAKKNWVM 308
Y+MYAPAS EE++ +F KRL+ GT L+A E+ +YKTA ++ GR Y + NWVM
Sbjct 241 DYVMYAPASDEEIEEIFAKRLSGGT-------LSACEVAKYKTAFMIFAGREYHRLNWVM 293
Query 309 QIHFGVQRNVNKKVFRNFGADGGVDAISNYAPADEMGALLNALNETDELPKTILYSLNPT 368
Q+H+GV+R+ N ++F G D G D ISNY PAD++ LNAL TDELPKTILYSLNP
Sbjct 294 QLHYGVKRDNNSRMFGKIGPDTGFDCISNYTPADQLADFLNALASTDELPKTILYSLNPV 353
Query 369 DNAAIGTIIGCFQDASCVGKIQHGAAWWFNDHKTGMIDQMTSLANLGLLGNFVGMLTDSR 428
DNAAIGTIIGCFQD+S +GKIQ G+AWWFND+KTGM++QMTSLANLG+L NFVGMLTDSR
Sbjct 354 DNAAIGTIIGCFQDSSAIGKIQQGSAWWFNDNKTGMMEQMTSLANLGMLSNFVGMLTDSR 413
Query 429 SFLSYTRHEYFRRIMCNLIGNWVENGEYPNDEKRLEQIIKGIACENARRYFEF 481
SFLSY RHEYFRRI+C LIG WVENGEYP+DEK LE+IIKGI+ NA RYF F
Sbjct 414 SFLSYPRHEYFRRILCELIGGWVENGEYPDDEKALEKIIKGISYNNAVRYFGF 466
Идентификатор e-value Организм Длина белка Длина выравнивания Сходство
WP_007157719.1 7e-148 Oribacterium sinus 431 236 86%
Query 20 MRNLEIEKVIGRQIIDSRGNPTVEAEVILSDGTVGRGAAPSGASTGEFEALELRDNDSSK 79
M LEIEKVIGR+IIDSRGNPTVEAEV+LSDGT+GRG APSGASTGEFEALELRD D S+
Sbjct 1 MSYLEIEKVIGREIIDSRGNPTVEAEVMLSDGTIGRGTAPSGASTGEFEALELRDGDKSR 60
Query 80 FGGKGVGKAVANINEVIAPALAGFDGSDLYGIDAKMIALDGTKDKSNLGANAILAVSLAA 139
FGGKGV KAV NIN +I L G D D+Y +D MI DGTKDKS LGANAILAVS+A
Sbjct 61 FGGKGVAKAVENINTIINDVLLGMDPMDIYAVDQAMIEADGTKDKSKLGANAILAVSIAT 120
Query 140 ASAAAKAQNIPLYRFLGGVNATTLPVPMMNILNGGAHATNSVDTQEFMIMPAGAPTFSEG 199
AAA A +IPLYRFLGG N LPVPMMNILNGGAHATNSVDTQEFMIMPAGAP+F EG
Sbjct 121 CKAAANALDIPLYRFLGGANGNRLPVPMMNILNGGAHATNSVDTQEFMIMPAGAPSFREG 180
Query 200 LRWSTEVFHALQKLLKEEGNTTAVGDEGGFAPDLASDEDAIEHILQAVKNAGYEPGRDFV 259
LRW TEVFHALQK+LK+EGNTTAVGDEGGFAP+LASDED IEHIL+A+K AGYEPG+DFV
Sbjct 181 LRWCTEVFHALQKILKDEGNTTAVGDEGGFAPNLASDEDTIEHILKAIKAAGYEPGKDFV 240
Query 260 IAMDAATSEWKSEKGIGFYRQPK 282
+AMDAA+SEWKSEKG GFY QPK
Sbjct 241 LAMDAASSEWKSEKGKGFYHQPK 263
Ниже приведены предсказания, полученные с помощью GeneMark:
Predicted genes
Gene Strand LeftEnd RightEnd Gene Class
# Length
1 - <3 791 789 1
2 - 1081 2499 1419 1
3 - 2594 2800 207 1

Рис. 2.График кодирующего потенциала.

Рис. 3.График кодирующего потенциала.
В графиках кодирующего потенциала видно, что чем больше потенциал, тем больше вероятность того, что данная рамка считывания окажется геном. И все предсказанные рамки совпали с настоящими генами. Полностью, с точностью до нуклеотида. И класс рамки 1 означает почти полную достоверность.
Вывод: программа предсказания генов Genemark предсказала гены правильно.
Последнее обновление: 16.09.2014