Рис. 1.Открытые рамки считывания, найденные программой ORF Finder.
Таблица 1.Рамки считывания, прошедшие фильтрацию по длине и перекрыванию.
начало | конец | длина | цепь | функция |
1081 | 2526 | 1446 | - | Мембранный белок |
2594 | 2800 | 207 | - | Диоксигеназа |
<1 | 848 | <848 | - | Енолаза |
Ниже приведены выравнивания, на основании которых было сделано заключение о функциях предполагаемых белков:
Идентификатор e-value Организм Длина белка Длина выравнивания Сходство WP_006859970.1 0.0 Marvinbryantia formatexigens 468 473 79% Query 10 MKKFMDEDFLLETETAKHLYHDYAEKMPIIDYHCHLSPKEIYEDQTYENITPVWLYGDHY 69 MK FMD+DFLL TETAK LYH+YAE MP++DYHCHL+P+EI ED+ +ENIT VWL GDHY Sbjct 1 MKPFMDKDFLLSTETAKKLYHNYAEVMPVLDYHCHLNPQEIAEDKHFENITEVWLGGDHY 60 Query 70 KWRQMRSNGCDESLVIGTASDHDKFIAWAKTLQMAIGNPLYHWSHLELKRYFDFDGYLCE 129 KWRQMRSNG +E + G A +KF WA+TL+ IGNPLYHWSHLEL+RYF + G+LC Sbjct 61 KWRQMRSNGVEEYYITGDAPAREKFQKWAETLEKLIGNPLYHWSHLELQRYFGYTGHLCA 120 Query 130 DNAEEVWNMTAEKL-QNGLSARKLIENSNVEVICTTDDPVDSLEWHKKIAEDDTFSVKVL 188 D AEEVWN+ EKL Q +SAR+LI+ S V ++CTTDDPVDSLEWH+KI D+TF V+VL Sbjct 121 DTAEEVWNLCNEKLAQPDMSARELIKRSGVTLVCTTDDPVDSLEWHEKIKADETFDVQVL 180 Query 189 PAWRPDQATNIEAEGFVSYVKKLEEVSGVSIESFDDLVAALSNRMDFFAENGCSVSDHGI 248 PAWRPD+A+ IE F YV KL EVSG+ ++SF DL A+ NRM++F E GCSVSDHG+ Sbjct 181 PAWRPDKASGIEKPAFPDYVAKLSEVSGIPVKSFADLKKAIVNRMEYFNERGCSVSDHGL 240 Query 249 AYMMYAPASAEEVDAVFKKRLAAGTVSGQEAGLTAQEINEYKTALLVALGRMYAKKNWVM 308 Y+MYAPAS EE++ +F KRL+ GT L+A E+ +YKTA ++ GR Y + NWVM Sbjct 241 DYVMYAPASDEEIEEIFAKRLSGGT-------LSACEVAKYKTAFMIFAGREYHRLNWVM 293 Query 309 QIHFGVQRNVNKKVFRNFGADGGVDAISNYAPADEMGALLNALNETDELPKTILYSLNPT 368 Q+H+GV+R+ N ++F G D G D ISNY PAD++ LNAL TDELPKTILYSLNP Sbjct 294 QLHYGVKRDNNSRMFGKIGPDTGFDCISNYTPADQLADFLNALASTDELPKTILYSLNPV 353 Query 369 DNAAIGTIIGCFQDASCVGKIQHGAAWWFNDHKTGMIDQMTSLANLGLLGNFVGMLTDSR 428 DNAAIGTIIGCFQD+S +GKIQ G+AWWFND+KTGM++QMTSLANLG+L NFVGMLTDSR Sbjct 354 DNAAIGTIIGCFQDSSAIGKIQQGSAWWFNDNKTGMMEQMTSLANLGMLSNFVGMLTDSR 413 Query 429 SFLSYTRHEYFRRIMCNLIGNWVENGEYPNDEKRLEQIIKGIACENARRYFEF 481 SFLSY RHEYFRRI+C LIG WVENGEYP+DEK LE+IIKGI+ NA RYF F Sbjct 414 SFLSYPRHEYFRRILCELIGGWVENGEYPDDEKALEKIIKGISYNNAVRYFGF 466 Идентификатор e-value Организм Длина белка Длина выравнивания Сходство WP_007157719.1 7e-148 Oribacterium sinus 431 236 86% Query 20 MRNLEIEKVIGRQIIDSRGNPTVEAEVILSDGTVGRGAAPSGASTGEFEALELRDNDSSK 79 M LEIEKVIGR+IIDSRGNPTVEAEV+LSDGT+GRG APSGASTGEFEALELRD D S+ Sbjct 1 MSYLEIEKVIGREIIDSRGNPTVEAEVMLSDGTIGRGTAPSGASTGEFEALELRDGDKSR 60 Query 80 FGGKGVGKAVANINEVIAPALAGFDGSDLYGIDAKMIALDGTKDKSNLGANAILAVSLAA 139 FGGKGV KAV NIN +I L G D D+Y +D MI DGTKDKS LGANAILAVS+A Sbjct 61 FGGKGVAKAVENINTIINDVLLGMDPMDIYAVDQAMIEADGTKDKSKLGANAILAVSIAT 120 Query 140 ASAAAKAQNIPLYRFLGGVNATTLPVPMMNILNGGAHATNSVDTQEFMIMPAGAPTFSEG 199 AAA A +IPLYRFLGG N LPVPMMNILNGGAHATNSVDTQEFMIMPAGAP+F EG Sbjct 121 CKAAANALDIPLYRFLGGANGNRLPVPMMNILNGGAHATNSVDTQEFMIMPAGAPSFREG 180 Query 200 LRWSTEVFHALQKLLKEEGNTTAVGDEGGFAPDLASDEDAIEHILQAVKNAGYEPGRDFV 259 LRW TEVFHALQK+LK+EGNTTAVGDEGGFAP+LASDED IEHIL+A+K AGYEPG+DFV Sbjct 181 LRWCTEVFHALQKILKDEGNTTAVGDEGGFAPNLASDEDTIEHILKAIKAAGYEPGKDFV 240 Query 260 IAMDAATSEWKSEKGIGFYRQPK 282 +AMDAA+SEWKSEKG GFY QPK Sbjct 241 LAMDAASSEWKSEKGKGFYHQPK 263
Ниже приведены предсказания, полученные с помощью GeneMark:
Predicted genes Gene Strand LeftEnd RightEnd Gene Class # Length 1 - <3 791 789 1 2 - 1081 2499 1419 1 3 - 2594 2800 207 1
Рис. 2.График кодирующего потенциала.
Рис. 3.График кодирующего потенциала.
В графиках кодирующего потенциала видно, что чем больше потенциал, тем больше вероятность того, что данная рамка считывания окажется геном. И все предсказанные рамки совпали с настоящими генами. Полностью, с точностью до нуклеотида. И класс рамки 1 означает почти полную достоверность.
Вывод: программа предсказания генов Genemark предсказала гены правильно.
Последнее обновление: 16.09.2014