Третий семестр

Главная



ORF Finder

Рис. 1.Открытые рамки считывания, найденные программой ORF Finder.

Таблица 1.Рамки считывания, прошедшие фильтрацию по длине и перекрыванию.

начало конец длина цепь функция
1081 2526 1446 - Мембранный белок
2594 2800 207 - Диоксигеназа
<1 848 <848 - Енолаза

Ниже приведены выравнивания, на основании которых было сделано заключение о функциях предполагаемых белков:


Идентификатор	e-value	Организм	            Длина белка	Длина выравнивания	Сходство
WP_006859970.1	0.0	    Marvinbryantia formatexigens	468	        473	                79%
Query  10   MKKFMDEDFLLETETAKHLYHDYAEKMPIIDYHCHLSPKEIYEDQTYENITPVWLYGDHY  69
            MK FMD+DFLL TETAK LYH+YAE MP++DYHCHL+P+EI ED+ +ENIT VWL GDHY
Sbjct  1    MKPFMDKDFLLSTETAKKLYHNYAEVMPVLDYHCHLNPQEIAEDKHFENITEVWLGGDHY  60

Query  70   KWRQMRSNGCDESLVIGTASDHDKFIAWAKTLQMAIGNPLYHWSHLELKRYFDFDGYLCE  129
            KWRQMRSNG +E  + G A   +KF  WA+TL+  IGNPLYHWSHLEL+RYF + G+LC 
Sbjct  61   KWRQMRSNGVEEYYITGDAPAREKFQKWAETLEKLIGNPLYHWSHLELQRYFGYTGHLCA  120

Query  130  DNAEEVWNMTAEKL-QNGLSARKLIENSNVEVICTTDDPVDSLEWHKKIAEDDTFSVKVL  188
            D AEEVWN+  EKL Q  +SAR+LI+ S V ++CTTDDPVDSLEWH+KI  D+TF V+VL
Sbjct  121  DTAEEVWNLCNEKLAQPDMSARELIKRSGVTLVCTTDDPVDSLEWHEKIKADETFDVQVL  180

Query  189  PAWRPDQATNIEAEGFVSYVKKLEEVSGVSIESFDDLVAALSNRMDFFAENGCSVSDHGI  248
            PAWRPD+A+ IE   F  YV KL EVSG+ ++SF DL  A+ NRM++F E GCSVSDHG+
Sbjct  181  PAWRPDKASGIEKPAFPDYVAKLSEVSGIPVKSFADLKKAIVNRMEYFNERGCSVSDHGL  240

Query  249  AYMMYAPASAEEVDAVFKKRLAAGTVSGQEAGLTAQEINEYKTALLVALGRMYAKKNWVM  308
             Y+MYAPAS EE++ +F KRL+ GT       L+A E+ +YKTA ++  GR Y + NWVM
Sbjct  241  DYVMYAPASDEEIEEIFAKRLSGGT-------LSACEVAKYKTAFMIFAGREYHRLNWVM  293

Query  309  QIHFGVQRNVNKKVFRNFGADGGVDAISNYAPADEMGALLNALNETDELPKTILYSLNPT  368
            Q+H+GV+R+ N ++F   G D G D ISNY PAD++   LNAL  TDELPKTILYSLNP 
Sbjct  294  QLHYGVKRDNNSRMFGKIGPDTGFDCISNYTPADQLADFLNALASTDELPKTILYSLNPV  353

Query  369  DNAAIGTIIGCFQDASCVGKIQHGAAWWFNDHKTGMIDQMTSLANLGLLGNFVGMLTDSR  428
            DNAAIGTIIGCFQD+S +GKIQ G+AWWFND+KTGM++QMTSLANLG+L NFVGMLTDSR
Sbjct  354  DNAAIGTIIGCFQDSSAIGKIQQGSAWWFNDNKTGMMEQMTSLANLGMLSNFVGMLTDSR  413

Query  429  SFLSYTRHEYFRRIMCNLIGNWVENGEYPNDEKRLEQIIKGIACENARRYFEF  481
            SFLSY RHEYFRRI+C LIG WVENGEYP+DEK LE+IIKGI+  NA RYF F
Sbjct  414  SFLSYPRHEYFRRILCELIGGWVENGEYPDDEKALEKIIKGISYNNAVRYFGF  466



Идентификатор	e-value	Организм	            Длина белка	Длина выравнивания	Сходство
WP_007157719.1	7e-148	Oribacterium sinus 	431	         236	            86%
Query  20   MRNLEIEKVIGRQIIDSRGNPTVEAEVILSDGTVGRGAAPSGASTGEFEALELRDNDSSK  79
            M  LEIEKVIGR+IIDSRGNPTVEAEV+LSDGT+GRG APSGASTGEFEALELRD D S+
Sbjct  1    MSYLEIEKVIGREIIDSRGNPTVEAEVMLSDGTIGRGTAPSGASTGEFEALELRDGDKSR  60

Query  80   FGGKGVGKAVANINEVIAPALAGFDGSDLYGIDAKMIALDGTKDKSNLGANAILAVSLAA  139
            FGGKGV KAV NIN +I   L G D  D+Y +D  MI  DGTKDKS LGANAILAVS+A 
Sbjct  61   FGGKGVAKAVENINTIINDVLLGMDPMDIYAVDQAMIEADGTKDKSKLGANAILAVSIAT  120

Query  140  ASAAAKAQNIPLYRFLGGVNATTLPVPMMNILNGGAHATNSVDTQEFMIMPAGAPTFSEG  199
              AAA A +IPLYRFLGG N   LPVPMMNILNGGAHATNSVDTQEFMIMPAGAP+F EG
Sbjct  121  CKAAANALDIPLYRFLGGANGNRLPVPMMNILNGGAHATNSVDTQEFMIMPAGAPSFREG  180

Query  200  LRWSTEVFHALQKLLKEEGNTTAVGDEGGFAPDLASDEDAIEHILQAVKNAGYEPGRDFV  259
            LRW TEVFHALQK+LK+EGNTTAVGDEGGFAP+LASDED IEHIL+A+K AGYEPG+DFV
Sbjct  181  LRWCTEVFHALQKILKDEGNTTAVGDEGGFAPNLASDEDTIEHILKAIKAAGYEPGKDFV  240

Query  260  IAMDAATSEWKSEKGIGFYRQPK  282
            +AMDAA+SEWKSEKG GFY QPK
Sbjct  241  LAMDAASSEWKSEKGKGFYHQPK  263

GeneMark

Ниже приведены предсказания, полученные с помощью GeneMark:

Predicted genes
    Gene    Strand    LeftEnd    RightEnd       Gene     Class
    #                                         Length
    1        -          <3         791          789        1
    2        -        1081        2499         1419        1
    3        -        2594        2800          207        1

Рис. 2.График кодирующего потенциала.

Рис. 3.График кодирующего потенциала.

В графиках кодирующего потенциала видно, что чем больше потенциал, тем больше вероятность того, что данная рамка считывания окажется геном. И все предсказанные рамки совпали с настоящими генами. Полностью, с точностью до нуклеотида. И класс рамки 1 означает почти полную достоверность.

Вывод: программа предсказания генов Genemark предсказала гены правильно.


© Рябых Григорий, 2014

Последнее обновление: 16.09.2014