В заданном фрагменте генома человека с помощью программы GeneScan были предсказаны следующие экзоны:
Таблица 1.Выдача GENSCAN.
Тип | Цепь | Начало | Конец |
Конечный | - | 1878 | 1699 |
Внутренний | - | 2970 | 2854 |
Внутренний | - | 3294 | 3223 |
Внутренний | - | 3549 | 3445 |
Внутренний | - | 5043 | 4882 |
Внутренний | - | 6029 | 5890 |
Внутренний | - | 6227 | 6160 |
Внутренний | - | 6482 | 6385 |
Внутренний | - | 6874 | 6743 |
Внутренний | - | 10933 | 10865 |
Внутренний | - | 12034 | 11870 |
Внутренний | - | 12393 | 12313 |
Внутренний | - | 12886 | 12733 |
Внутренний | - | 13724 | 13539 |
Начальный | - | 15474 | 15359 |
Нашёл свою последовательность в геноме человека. Ее координаты: chr5:159,828,600-159,846,200. С помощью Genome browser было получено графическое изображение выравнивания данного фрагмента генома человека с известными мРНК и EST (на рисунках ниже).
Рис. 1.Альтернативный донорный сайт сплайсинга.
Рис. 2.Кассетный экзон.
В моём контиге нашлись три гена.
protein kinase family protein. - | |
Координаты по белку | Координаты по ДНК |
27 | 47316 |
50 | 47245 |
52 | 47162 |
125 | 46943 |
126 | 46932 |
136 | 46902 |
120 | 46074 |
163 | 45943 |
162 | 45629 |
188 | 45549 |
188 | 45332 |
256 | 45123 |
250 | 45048 |
294 | 44914 |
297 | 44495 |
380 | 44235 |
Этот белок нашелся только по Refseq. 1 Query 47316 WFCLFRNRSVSRTSETGSSDPSVQ 47245 WFC+FR +++SRTSETGSSDPS Q Sbjct 27 WFCVFRRKNLSRTSETGSSDPSTQ 50 2 Query 47162 GRNTGVELTLREARRFDIEELYLATKSFSDKNLIGEGKFGPVYKGWLNDGMLVAIKKRAG 46983 GRN +EL++REARRF++EEL ATKSF++K+LIG GKFG VYKG L DG+LVAIKKR G Sbjct 52 GRNVAIELSMREARRFEMEELAQATKSFTNKSLIGIGKFGEVYKGLLQDGVLVAIKKRPG 111 Query 46982 APSQEFIEEVMITFLSYVVN 46943 P+QEF+ EV +LS + + Sbjct 112 LPTQEFVNEVR--YLSSIHH 125 3 Query 46074 QVRYLSAIHHRNLVTLLGYCQENDQQILVYEYIPNGSVSVHLYG 45943 +VRYLS+IHHRNLVTLLG+CQE++ Q LVYEY+PNGSVS HLYG Sbjct 120 EVRYLSSIHHRNLVTLLGFCQESNTQFLVYEYVPNGSVSSHLYG 163 4 Query 45629 FVGAGQVSKEKLEFKHRLSIGLGAAKG 45549 + G+V +LEF+HRL+I +GAAKG Sbjct 162 YGAGGKVPGNRLEFRHRLAISIGAAKG 188 5 Query 45332 GLAHIHSLSPRLVHKDFKTANVLVDENFIAKVADAGLRNFLGRDDIAGPSSVVAADVIFL 45153 GLAH+HSLSPRL+HKDFKTANVLVDENFIAKVADAG+RNFLGR+D+ G SS + AD IFL Sbjct 188 GLAHLHSLSPRLIHKDFKTANVLVDENFIAKVADAGVRNFLGREDV-GTSSHIVADQIFL 246 Query 45152 APEYYSLQIF 45123 +PE + F Sbjct 247 SPEVQEFKRF 256 6 Query 45048 VREFRRFSEKSDVYSFGIFLLELVSGREAVDLLSSDLDQNLVEWV 44914 V+EF+RFSEKSDVY+FG+FLLELVSGREA + S Q LV+W+ Sbjct 250 VQEFKRFSEKSDVYAFGVFLLELVSGREASEPSPSSSTQTLVDWM 294 7 Query 44495 VQNFQDSGKIHTIIDQRLGNSFTTEGMEEFMQLIVRCVNLSSERRPSMSYVVMELDRLLE 44316 +QN D I +ID+RLG ++T EG+EE + L +RCV++SSE+RP+MS+VV EL+R+L+ Sbjct 294 MQNLTDYADIPMMIDERLGGTYTAEGVEELITLTLRCVDVSSEKRPTMSFVVTELERILD 353 Query 44315 KEMSLTTIMGEGTPVVTLGSQLFRASK 44235 KE+SLTT+MGEGTP VTLGSQLF+A+K Sbjct 354 KEVSLTTVMGEGTPTVTLGSQLFKATK 380
Для оценки следующего выравнивания вычислил перекрывание (query cover, QC), так как находки были получены в двух базах данных.
nudix hydrolase 13 sp|Q93ZY7.1, + | ||||
Координаты по белку | Координаты по ДНК | Уточненные координаты по белку | Уточненные координаты по ДНК | QC |
1 | 78025 | 1 | 78025 | 1 |
26 | 78102 | 26 | 78102 | |
25 | 78883 | 25 | 78883 | 0.98 |
64 | 78993 | 65 | 78993 | |
64 | 79106 | 65 | 79106 | 0.93 |
92 | 79192 | 93 | 79192 | |
94 | 79894 | 96 | 79894 | 0.94 |
145 | 80043 | 144 | 80043 | |
145 | 80243 | 144 | 80243 | 0.81 |
173 | 80329 | 180 | 80353 |
1 Query 78025 MASVVARTGRHRQRYDNNNLRLVSG 78102 M+ + +RTGR RQRYD NN RLVSG Sbjct 1 MSVLSSRTGRDRQRYD-NNFRLVSG 26 2 Query 78883 CIPYRVAKHDDHHGDS----EHKIEVLMISSPNRDDLVFPK 78993 CIPYR+ K D+ DS +K+EVLM+SSPNR DLVFPK Sbjct 25 CIPYRLMKADETEEDSGVDFVNKLEVLMVSSPNRHDLVFPK 65 3 Query 79106 QGGWDDDetceeaacrealeeaGVKGILK 79192 +GGW+DDET EAA REA+EEAGVKGIL+ Sbjct 65 KGGWEDDETVLEAASREAIEEAGVKGILR 93 4 Query 79897 PLGVWEFRSKSSQKICSLKGGCKGYMFALEVTEELEVWPEQGNRDRKWV 80043 PLGVWEFRSKSS GGCKGYMFAL+VTEELE WPE+ NR+R+W+ Sbjct 96 PLGVWEFRSKSSTVEDECLGGCKGYMFALKVTEELEDWPERKNRERRWL 144 5 Query 80243 LCIKEAFKLCRYEWMCRALEKFLAVMTEDRKHEMWEE 80353 L +KEA +LCRYEWM RALE+FL VM ++R+ EE Sbjct 144 LTVKEALELCRYEWMQRALEEFLRVMEDERRLRTEEE 180
Syntaxin-22, sp|P93654.1, + | |
Координаты по белку | Координаты по ДНК |
1 | 84802 |
61 | 84978 |
63 | 85518 |
87 | 85592 |
94 | 86540 |
141 | 86683 |
161 | 87983 |
216 | 88150 |
Этот белок нашёлся только по Swissprot. 1 Query 84802 MSFQDLQNGAKPSSSA--GRPQNPSQAVATGIFQINTAVAAFRRLVDAIGTTKDTPDHRH 84975 MSFQDL++G S+ G Q+ +QAVA+GIFQINT V+ F+RLV+ +GT KDTP+ R Sbjct 1 MSFQDLESGRGRSTRKFNGGRQDSTQAVASGIFQINTGVSTFQRLVNTLGTPKDTPELRE 60 Query 84976 K 84978 K Sbjct 61 K 61 2 Query 85518 HNTRQRIMQLVKETSAKLKSLSETD 85592 H TR I QLVK+TSAKLK SETD Sbjct 63 HKTRLHIGQLVKDTSAKLKEASETD 87 3 Query 86540 PSKRIEDAKLARDFQTTLQEFQKVQQLASERESTYSPFDPSSSMTTTY 86683 PSK+I DAKLARDFQ L+EFQK QQ A+ERE+TY+PF P S++ ++Y Sbjct 94 PSKKIADAKLARDFQAVLKEFQKAQQTAAERETTYTPFVPQSALPSSY 141 4 Query 87983 RQEILLLGNEISFNEAIIDEREqgirdiqdqigqANEIFKDLAVLVHEQGVVIGKI 88150 RQE++LL NEI+FNEA+I+EREQGI++I QIG+ NEIFKDLAVLV++QGV+I I Sbjct 161 RQELVLLDNEIAFNEAVIEEREQGIQEIHQQIGEVNEIFKDLAVLVNDQGVMIDDI 216Дата последнего обновления: 16.02.2015