В заданном фрагменте генома человека с помощью программы GeneScan были предсказаны следующие экзоны:
Таблица 1.Выдача GENSCAN.
| Тип | Цепь | Начало | Конец |
| Конечный | - | 1878 | 1699 |
| Внутренний | - | 2970 | 2854 |
| Внутренний | - | 3294 | 3223 |
| Внутренний | - | 3549 | 3445 |
| Внутренний | - | 5043 | 4882 |
| Внутренний | - | 6029 | 5890 |
| Внутренний | - | 6227 | 6160 |
| Внутренний | - | 6482 | 6385 |
| Внутренний | - | 6874 | 6743 |
| Внутренний | - | 10933 | 10865 |
| Внутренний | - | 12034 | 11870 |
| Внутренний | - | 12393 | 12313 |
| Внутренний | - | 12886 | 12733 |
| Внутренний | - | 13724 | 13539 |
| Начальный | - | 15474 | 15359 |
Нашёл свою последовательность в геноме человека. Ее координаты: chr5:159,828,600-159,846,200. С помощью Genome browser было получено графическое изображение выравнивания данного фрагмента генома человека с известными мРНК и EST (на рисунках ниже).

Рис. 1.Альтернативный донорный сайт сплайсинга.

Рис. 2.Кассетный экзон.
В моём контиге нашлись три гена.
| protein kinase family protein. - | |
| Координаты по белку | Координаты по ДНК |
| 27 | 47316 |
| 50 | 47245 |
| 52 | 47162 |
| 125 | 46943 |
| 126 | 46932 |
| 136 | 46902 |
| 120 | 46074 |
| 163 | 45943 |
| 162 | 45629 |
| 188 | 45549 |
| 188 | 45332 |
| 256 | 45123 |
| 250 | 45048 |
| 294 | 44914 |
| 297 | 44495 |
| 380 | 44235 |
Этот белок нашелся только по Refseq.
1
Query 47316 WFCLFRNRSVSRTSETGSSDPSVQ 47245
WFC+FR +++SRTSETGSSDPS Q
Sbjct 27 WFCVFRRKNLSRTSETGSSDPSTQ 50
2
Query 47162 GRNTGVELTLREARRFDIEELYLATKSFSDKNLIGEGKFGPVYKGWLNDGMLVAIKKRAG 46983
GRN +EL++REARRF++EEL ATKSF++K+LIG GKFG VYKG L DG+LVAIKKR G
Sbjct 52 GRNVAIELSMREARRFEMEELAQATKSFTNKSLIGIGKFGEVYKGLLQDGVLVAIKKRPG 111
Query 46982 APSQEFIEEVMITFLSYVVN 46943
P+QEF+ EV +LS + +
Sbjct 112 LPTQEFVNEVR--YLSSIHH 125
3
Query 46074 QVRYLSAIHHRNLVTLLGYCQENDQQILVYEYIPNGSVSVHLYG 45943
+VRYLS+IHHRNLVTLLG+CQE++ Q LVYEY+PNGSVS HLYG
Sbjct 120 EVRYLSSIHHRNLVTLLGFCQESNTQFLVYEYVPNGSVSSHLYG 163
4
Query 45629 FVGAGQVSKEKLEFKHRLSIGLGAAKG 45549
+ G+V +LEF+HRL+I +GAAKG
Sbjct 162 YGAGGKVPGNRLEFRHRLAISIGAAKG 188
5
Query 45332 GLAHIHSLSPRLVHKDFKTANVLVDENFIAKVADAGLRNFLGRDDIAGPSSVVAADVIFL 45153
GLAH+HSLSPRL+HKDFKTANVLVDENFIAKVADAG+RNFLGR+D+ G SS + AD IFL
Sbjct 188 GLAHLHSLSPRLIHKDFKTANVLVDENFIAKVADAGVRNFLGREDV-GTSSHIVADQIFL 246
Query 45152 APEYYSLQIF 45123
+PE + F
Sbjct 247 SPEVQEFKRF 256
6
Query 45048 VREFRRFSEKSDVYSFGIFLLELVSGREAVDLLSSDLDQNLVEWV 44914
V+EF+RFSEKSDVY+FG+FLLELVSGREA + S Q LV+W+
Sbjct 250 VQEFKRFSEKSDVYAFGVFLLELVSGREASEPSPSSSTQTLVDWM 294
7
Query 44495 VQNFQDSGKIHTIIDQRLGNSFTTEGMEEFMQLIVRCVNLSSERRPSMSYVVMELDRLLE 44316
+QN D I +ID+RLG ++T EG+EE + L +RCV++SSE+RP+MS+VV EL+R+L+
Sbjct 294 MQNLTDYADIPMMIDERLGGTYTAEGVEELITLTLRCVDVSSEKRPTMSFVVTELERILD 353
Query 44315 KEMSLTTIMGEGTPVVTLGSQLFRASK 44235
KE+SLTT+MGEGTP VTLGSQLF+A+K
Sbjct 354 KEVSLTTVMGEGTPTVTLGSQLFKATK 380
Для оценки следующего выравнивания вычислил перекрывание (query cover, QC), так как находки были получены в двух базах данных.
| nudix hydrolase 13 sp|Q93ZY7.1, + | ||||
| Координаты по белку | Координаты по ДНК | Уточненные координаты по белку | Уточненные координаты по ДНК | QC |
| 1 | 78025 | 1 | 78025 | 1 |
| 26 | 78102 | 26 | 78102 | |
| 25 | 78883 | 25 | 78883 | 0.98 |
| 64 | 78993 | 65 | 78993 | |
| 64 | 79106 | 65 | 79106 | 0.93 |
| 92 | 79192 | 93 | 79192 | |
| 94 | 79894 | 96 | 79894 | 0.94 |
| 145 | 80043 | 144 | 80043 | |
| 145 | 80243 | 144 | 80243 | 0.81 |
| 173 | 80329 | 180 | 80353 |
1
Query 78025 MASVVARTGRHRQRYDNNNLRLVSG 78102
M+ + +RTGR RQRYD NN RLVSG
Sbjct 1 MSVLSSRTGRDRQRYD-NNFRLVSG 26
2
Query 78883 CIPYRVAKHDDHHGDS----EHKIEVLMISSPNRDDLVFPK 78993
CIPYR+ K D+ DS +K+EVLM+SSPNR DLVFPK
Sbjct 25 CIPYRLMKADETEEDSGVDFVNKLEVLMVSSPNRHDLVFPK 65
3
Query 79106 QGGWDDDetceeaacrealeeaGVKGILK 79192
+GGW+DDET EAA REA+EEAGVKGIL+
Sbjct 65 KGGWEDDETVLEAASREAIEEAGVKGILR 93
4
Query 79897 PLGVWEFRSKSSQKICSLKGGCKGYMFALEVTEELEVWPEQGNRDRKWV 80043
PLGVWEFRSKSS GGCKGYMFAL+VTEELE WPE+ NR+R+W+
Sbjct 96 PLGVWEFRSKSSTVEDECLGGCKGYMFALKVTEELEDWPERKNRERRWL 144
5
Query 80243 LCIKEAFKLCRYEWMCRALEKFLAVMTEDRKHEMWEE 80353
L +KEA +LCRYEWM RALE+FL VM ++R+ EE
Sbjct 144 LTVKEALELCRYEWMQRALEEFLRVMEDERRLRTEEE 180
| Syntaxin-22, sp|P93654.1, + | |
| Координаты по белку | Координаты по ДНК |
| 1 | 84802 |
| 61 | 84978 |
| 63 | 85518 |
| 87 | 85592 |
| 94 | 86540 |
| 141 | 86683 |
| 161 | 87983 |
| 216 | 88150 |
Этот белок нашёлся только по Swissprot.
1
Query 84802 MSFQDLQNGAKPSSSA--GRPQNPSQAVATGIFQINTAVAAFRRLVDAIGTTKDTPDHRH 84975
MSFQDL++G S+ G Q+ +QAVA+GIFQINT V+ F+RLV+ +GT KDTP+ R
Sbjct 1 MSFQDLESGRGRSTRKFNGGRQDSTQAVASGIFQINTGVSTFQRLVNTLGTPKDTPELRE 60
Query 84976 K 84978
K
Sbjct 61 K 61
2
Query 85518 HNTRQRIMQLVKETSAKLKSLSETD 85592
H TR I QLVK+TSAKLK SETD
Sbjct 63 HKTRLHIGQLVKDTSAKLKEASETD 87
3
Query 86540 PSKRIEDAKLARDFQTTLQEFQKVQQLASERESTYSPFDPSSSMTTTY 86683
PSK+I DAKLARDFQ L+EFQK QQ A+ERE+TY+PF P S++ ++Y
Sbjct 94 PSKKIADAKLARDFQAVLKEFQKAQQTAAERETTYTPFVPQSALPSSY 141
4
Query 87983 RQEILLLGNEISFNEAIIDEREqgirdiqdqigqANEIFKDLAVLVHEQGVVIGKI 88150
RQE++LL NEI+FNEA+I+EREQGI++I QIG+ NEIFKDLAVLV++QGV+I I
Sbjct 161 RQELVLLDNEIAFNEAVIEEREQGIQEIHQQIGEVNEIFKDLAVLVNDQGVMIDDI 216
Дата последнего обновления: 16.02.2015