В заданном фрагменте генома человека с помощью программы GeneScan были предсказаны следующие экзоны:
Таблица 1.Выдача GENSCAN.
Начало | Конец | Цепь | Тип | |
1157 | 1593 | Внутренний | + | |
1699 | 1783 | Внутренний | + | |
8843 | 8930 | Внутренний | + | |
34135 | 34252 | Внутренний | + | |
34813 | 34963 | Внутренний | + | |
38185 | 38297 | Конечный | + |
Нашла свою последовательность в геноме человека. Ее координаты: chr13:108,921,000-108,959,700. С помощью Genome browser было получено графическое изображение выравнивания данного фрагмента генома человека с известными мРНК и EST (на рисунках ниже).
Рис. 1.Удержанный интрон.
Рис. 2.Кассетный экзон.
Чередующиеся экзоны, альтернативные донорные и акцепторные сайты сплайсинга в моей последовательности найдены не были.
Гипотетический белок
Координаты по белку | Координаты по ДНК | Уточненные координаты по белку | Уточненные координаты по ДНК |
35 | 22870 | 28 | 22870 |
88 | 22706 | 81 | 22706 |
78 | 22664 | 71 | 22664 |
106 | 22572 | 99 | 22572 |
108 | 22455 | 100 | 22455 |
142 | 22351 | 136 | 22351 |
176 | 21845 | 169 | 21845 |
198 | 21777 | 191 | 21777 |
196 | 21696 | 189 | 21696 |
217 | 21631 | 215 | 21616 |
239 | 21478 | 225 | 21502 |
390 | 20936 | 383 | 20936 |
384 | 19876 | 365 | 19942 |
522 | 19460 | 511 | 19472 |
518 | 18590 | 511 | 18590 |
624 | 18282 | 618 | 18282 |
Range 1: Query 22870 NFVVEALVKIKNALNDPRGALNNWDEDSVDPCSWAMITCSSDNLVTGLYVLPSSS 22706 N V+ALV IK ALNDP G LNNWDEDSVDPCSWAMITCS +NLV GL PS S Sbjct 28 NHEVDALVSIKRALNDPHGVLNNWDEDSVDPCSWAMITCSPENLVIGLGA-PSQS 81 Range 2: Query 22664 LIFGFYRGAPSQGLSGKLSGMIANLTNLRQV 22572 L+ G GAPSQ LSG LSG I NLTNLRQV Sbjct 71 LVIGL--GAPSQSLSGTLSGSIGNLTNLRQV 99 Range 3: Query 22458 LLQNNNISSEIPPEIGVLPNLHTLDLSNNQFSGHMPE 22348 LLQNNNIS IPP++G LP L TLDLSNN+ SG +P Sbjct 100 LLQNNNISGGIPPQLGSLPKLQTLDLSNNRLSGVIPR 136 Range 4: Query 21845 SFRDLSYNNLSGPVPKFPARTFK 21777 +F DLSYNNLSGPVPKFPARTF Sbjct 169 AFLDLSYNNLSGPVPKFPARTFN 191 Range 5: Query 21696 TCSIVGNSLICGSHSIEGCSGSAFPIP 21616 T ++ GN LICGS S CSGSA +P Sbjct 189 TFNVAGNPLICGSSSTNVCSGSANSVP 215 Range 6 Query 21502 GKPSSKKLAIALGVSLSFVSLILIVVGFLFRRRNRTKKQTILDIT 21323 GK +SKKLAIALGVS SLIL+ G ++ R+ R K TIL+I Sbjct 225 GKHNSKKLAIALGVSFGVASLILLAFGLIWYRK-RQKNLTILNIG 268 Query 21322 DLQEEGLMSLGNLRIFTFRELQVATDNFSSKNILGAGGFGNVYKGK 21143 D QEEGL+SLGNLR FTFRELQ AT+NFSSKNILGAGGFGNVYKGK Sbjct 269 DKQEEGLISLGNLRNFTFRELQQATENFSSKNILGAGGFGNVYKGK 314 Query 21142 LGDSTMVAVKRLKDVIGTAGESQFRTELEMISLAVHRNLLRLTGYCATPNERLLVYPYMS 20963 LGD T++AVKRLKDV GT GESQFRTELEMISLAVHRNLLRL GYCATP ERLLVYPYMS Sbjct 315 LGDGTVLAVKRLKDVAGTFGESQFRTELEMISLAVHRNLLRLIGYCATPTERLLVYPYMS 374 Query 20962 NGSVASRLR 20936 NGSVASRLR Sbjct 375 NGSVASRLR 383 Range 7 Query 19942 EQCLWYGFLMNTSVVLIITEKPALDWNTRKRIAIGAARGLLYLHEQCDPK 19763 E+ L Y ++ N SV + EKPALDWNTRKRIAIGAARGLLYLHEQCDPK Sbjct 365 ERLLVYPYMSNGSVASRLREKPALDWNTRKRIAIGAARGLLYLHEQCDPK 414 Query 19762 IIHRDVKAANILLDDFCEAVVGDFGLAKLLDHADSHVTTAVRGTVGHIAPEYLSTGQSSE 19583 IIHRDVKAAN+LLDDFCEA+VGDFGLAKLLDH+DSHVTTAVRGTVGHIAPEYLSTGQSSE Sbjct 415 IIHRDVKAANVLLDDFCEAIVGDFGLAKLLDHSDSHVTTAVRGTVGHIAPEYLSTGQSSE 474 Query 19582 KTDVFGFGILLLELITGMRALEFGKTVNQKGAMLEWV 19472 KTDVFGFGILLLELITGMRALEFGK++NQKGAMLEWV Sbjct 475 KTDVFGFGILLLELITGMRALEFGKSINQKGAMLEWV 511 Range 8 Query 18590 VRKVQQEKKVEQLVDRELGTNYDRIDVGEMLQVALLCTQYLPAHRPKMSEVVRMLEGDGL 18411 V+K+QQEKKVE LVDRELG+NYDRI+VGE+LQVALLCTQYLP HRPKMSEVVRMLEGDGL Sbjct 511 VKKIQQEKKVEVLVDRELGSNYDRIEVGEILQVALLCTQYLPVHRPKMSEVVRMLEGDGL 570 Query 18410 AEKWAASHNHHLNPTTNFF----LPLKSNPSMVPRHD--DDDDRLSMFG 18282 AEKWAA+HN H NPT N F S P+ P+HD + +D+ SMFG Sbjct 571 AEKWAAAHN-HTNPTMNNFHTNTKKSTSCPTSAPKHDHEEKNDQSSMFG 618
Белок YORE-YORE
Координаты по белку | Координаты по ДНК | |||
16 | 93124 | |||
96 | 96363 | |||
93 | 96742 | |||
177 | 96981 | |||
173 | 98043 | |||
284 | 98270 | |||
249 | 99864 | |||
291 | 99992 | |||
289 | 101688 | |||
376 | 101951 | |||
376 | 102780 | |||
412 | 102890 | |||
431 | 103685 | |||
482 | 103894 | |||
482 | 104700 | |||
518 | 104810 | |||
519 | 105203 | |||
576 | 105376 | |||
576 | 106105 | |||
629 | 106266 |
Range 1: Query 96124 VQYLIYGPFLAQVLYSRT-QEDSMKNNWCLHILIICFLRACMYQLWNSCSSMLFLNRNRR 96300 ++YL+Y P AQV+YS +ED K WC+HILIIC L+A +++LW+ ++MLF+ R R Sbjct 16 LKYLLYAPLAAQVVYSWVYEEDISKVLWCIHILIICGLKALVHELWSVFNNMLFVTRTLR 75 Query 96301 ILEQGVDFKQIDKEWDW*LYI 96363 I +G+DFKQID EW W YI Sbjct 76 INPKGIDFKQIDHEWHWDNYI 96 Range 2: Query 96742 DNFVILQALMASIACSIFP----FLSNLPLWDSRSLIVAIIFHMGVSEPIYYWAHKGFH- 96906 DN++ILQA++ S+ C + P +++LPLW+++ LI I+ H+ SEP+YY+ H+ FH Sbjct 93 DNYIILQAIIVSLICYMSPPLMMMINSLPLWNTKGLIALIVLHVTFSEPLYYFLHRSFHR 152 Query 96907 GNYLFTHYHSFHHSSPVPQPFTGKD 96981 NY FTHYHSFHHSSPVP P T + Sbjct 153 NNYFFTHYHSFHHSSPVPHPMTAGN 177 Range 3: Query 98043 VAAGSVSFLEDIVLSGVIGIPLLGTCLIGCGSIYMIYGYVLMFDLMRCLGHCNVEIVPHQ 98222 + AG+ + LE+I+L V G+PL+G CL G GS+ IYGY +MFD MRCLGHCNVEI H+ Sbjct 173 MTAGNATLLENIILCVVAGVPLIGCCLFGVGSLSAIYGYAVMFDFMRCLGHCNVEIFSHK 232 Query 98223 LFEKFPTLKYFLYTPT 98270 LFE P L+Y +YTPT Sbjct 233 LFEILPVLRYLIYTPT 248 Range 4: Query 99864 YHSLHHTEMDTNYCLFMPLYDALGNTLNSKSWELHKKNSSNSG 99992 YHSLHH EM TN+CLFMPL+D LG+T N SWEL KK ++G Sbjct 249 YHSLHHQEMGTNFCLFMPLFDVLGDTQNPNSWELQKKIRLSAG 291 Range 5: Query 101688 NAGKNWRVPDFVFLAHVVDLTSALHSPFVFRSFSSTPFMTKIFLIPFLPIVFMVMLVMWA 101867 +AG+ RVP+FVFLAH VD+ SA+H+PFVFRSF+S P+ T+IFL+P P F VML MWA Sbjct 289 SAGERKRVPEFVFLAHGVDVMSAMHAPFVFRSFASMPYTTRIFLLPMWPFTFCVMLGMWA 348 Query 101868 KSKTFLFSFYGLRGRLHQTWVVPRFGFQ 101951 SKTFLFSFY LR L QTW VPRFGFQ Sbjct 349 WSKTFLFSFYTLRNNLCQTWGVPRFGFQ 376 Range 6: Query 102780 QYFLPFARDGINKQIEEAILRADRLGVKVLSLAALNK 102890 QYFLPFA GIN QIE AILRAD++GVKV+SLAALNK Sbjct 376 QYFLPFATKGINDQIEAAILRADKIGVKVISLAALNK 412 Range 7: Query 103685 NEALNGGGTLFVDKHPNLRVRVVHGNTLTAAVILNEIEEDVKEVFLTGATSKLGRAIALY 103864 NEALNGGGTLFV+KHP+LRVRVVHGNTLTAAVIL EI +DV EVFLTGATSKLGRAIALY Sbjct 413 NEALNGGGTLFVNKHPDLRVRVVHGNTLTAAVILYEIPKDVNEVFLTGATSKLGRAIALY 472 Query 103865 LSTRRVKVLV 103894 L R V+VL+ Sbjct 473 LCRRGVRVLM 482 Range 8: Query 104700 MLTISSERFQKIQKEVPTEFHKYLVQVTKYQAAKNCK 104810 MLT+S ERFQKIQKE P EF LVQVTKY AA++CK Sbjct 482 MLTLSMERFQKIQKEAPVEFQNNLVQVTKYNAAQHCK 518 Range 9: Query 105203 TWIVGKWITPREQSWAPPGAHFHQFVVPPILPFRRDCTYGDLAAMRLPDDVQGLGSCE 105376 TWIVGKW+TPREQSWAP G HFHQFVVPPIL FRR+CTYGDLAAM+LP DV+GLG+CE Sbjct 519 TWIVGKWLTPREQSWAPAGTHFHQFVVPPILKFRRNCTYGDLAAMKLPKDVEGLGTCE 576 Range 10 Query 106105 QYTMERgvvhachaggvvhSLEGWNHHEVGAIDVERIDLVWRAALKHGLKPVST 106266 +YTMERGVVHACHAGGVVH LEGW HHEVGAIDV+RIDLVW AA+K+GL VS+ Sbjct 576 EYTMERGVVHACHAGGVVHMLEGWKHHEVGAIDVDRIDLVWEAAMKYGLSAVSS 629
Дата последнего обновления: 15.09.2014
Copyright © Кузнецова Мария, 2013.