Учебный сайт Дюгая Ильи

Главная

Первый семестр

Второй семестр

Ссылки

Об авторе

GENESCAN

В заданном фрагменте генома человека с помощью программы GeneScan были предсказаны следующие экзоны:

Таблица 1.Выдача GENSCAN.

ТипЦепьНачалоКонец
Конечный-18781699
Внутренний-29702854
Внутренний-32943223
Внутренний-35493445
Внутренний-50434882
Внутренний-60295890
Внутренний-62276160
Внутренний-64826385
Внутренний-68746743
Внутренний-1093310865
Внутренний-1203411870
Внутренний-1239312313
Внутренний-1288612733
Внутренний-1372413539
Начальный-1547415359

Genome browser

Нашёл свою последовательность в геноме человека. Ее координаты: chr5:159,828,600-159,846,200. С помощью Genome browser было получено графическое изображение выравнивания данного фрагмента генома человека с известными мРНК и EST (на рисунках ниже).

Рис. 1.Альтернативный донорный сайт сплайсинга.

Рис. 2.Кассетный экзон.

BLASTX

В моём контиге нашлись три гена.

protein kinase family protein. -
Координаты по белкуКоординаты по ДНК
2747316
5047245
5247162
12546943
12646932
13646902
12046074
16345943
16245629
18845549
18845332
25645123
25045048
29444914
29744495
38044235
Этот белок нашелся только по Refseq.

1
Query  47316  WFCLFRNRSVSRTSETGSSDPSVQ  47245
              WFC+FR +++SRTSETGSSDPS Q
Sbjct  27     WFCVFRRKNLSRTSETGSSDPSTQ  50


2
Query  47162  GRNTGVELTLREARRFDIEELYLATKSFSDKNLIGEGKFGPVYKGWLNDGMLVAIKKRAG  46983
              GRN  +EL++REARRF++EEL  ATKSF++K+LIG GKFG VYKG L DG+LVAIKKR G
Sbjct  52     GRNVAIELSMREARRFEMEELAQATKSFTNKSLIGIGKFGEVYKGLLQDGVLVAIKKRPG  111

Query  46982  APSQEFIEEVMITFLSYVVN 46943
               P+QEF+ EV   +LS + +
Sbjct  112    LPTQEFVNEVR--YLSSIHH  125


3
Query  46074  QVRYLSAIHHRNLVTLLGYCQENDQQILVYEYIPNGSVSVHLYG  45943
              +VRYLS+IHHRNLVTLLG+CQE++ Q LVYEY+PNGSVS HLYG
Sbjct  120    EVRYLSSIHHRNLVTLLGFCQESNTQFLVYEYVPNGSVSSHLYG  163


4
Query  45629  FVGAGQVSKEKLEFKHRLSIGLGAAKG  45549
              +   G+V   +LEF+HRL+I +GAAKG
Sbjct  162    YGAGGKVPGNRLEFRHRLAISIGAAKG  188


5
Query  45332  GLAHIHSLSPRLVHKDFKTANVLVDENFIAKVADAGLRNFLGRDDIAGPSSVVAADVIFL  45153
              GLAH+HSLSPRL+HKDFKTANVLVDENFIAKVADAG+RNFLGR+D+ G SS + AD IFL
Sbjct  188    GLAHLHSLSPRLIHKDFKTANVLVDENFIAKVADAGVRNFLGREDV-GTSSHIVADQIFL  246

Query  45152  APEYYSLQIF  45123
              +PE    + F
Sbjct  247    SPEVQEFKRF  256


6
Query  45048  VREFRRFSEKSDVYSFGIFLLELVSGREAVDLLSSDLDQNLVEWV  44914
              V+EF+RFSEKSDVY+FG+FLLELVSGREA +   S   Q LV+W+
Sbjct  250    VQEFKRFSEKSDVYAFGVFLLELVSGREASEPSPSSSTQTLVDWM  294


7
Query  44495  VQNFQDSGKIHTIIDQRLGNSFTTEGMEEFMQLIVRCVNLSSERRPSMSYVVMELDRLLE  44316
              +QN  D   I  +ID+RLG ++T EG+EE + L +RCV++SSE+RP+MS+VV EL+R+L+
Sbjct  294    MQNLTDYADIPMMIDERLGGTYTAEGVEELITLTLRCVDVSSEKRPTMSFVVTELERILD  353

Query  44315  KEMSLTTIMGEGTPVVTLGSQLFRASK  44235
              KE+SLTT+MGEGTP VTLGSQLF+A+K
Sbjct  354    KEVSLTTVMGEGTPTVTLGSQLFKATK  380

Для оценки следующего выравнивания вычислил перекрывание (query cover, QC), так как находки были получены в двух базах данных.

nudix hydrolase 13 sp|Q93ZY7.1, +
Координаты по белкуКоординаты по ДНКУточненные координаты по белкуУточненные координаты по ДНКQC
1780251780251
26781022678102
257888325788830.98
64789936578993
647910665791060.93
92791929379192
947989496798940.94
1458004314480043
14580243144802430.81
1738032918080353
1
Query  78025  MASVVARTGRHRQRYDNNNLRLVSG 78102
              M+ + +RTGR RQRYD NN RLVSG 
Sbjct  1      MSVLSSRTGRDRQRYD-NNFRLVSG  26


2
Query  78883  CIPYRVAKHDDHHGDS----EHKIEVLMISSPNRDDLVFPK  78993
              CIPYR+ K D+   DS     +K+EVLM+SSPNR DLVFPK
Sbjct  25     CIPYRLMKADETEEDSGVDFVNKLEVLMVSSPNRHDLVFPK  65


3
Query  79106  QGGWDDDetceeaacrealeeaGVKGILK  79192
              +GGW+DDET  EAA REA+EEAGVKGIL+
Sbjct  65     KGGWEDDETVLEAASREAIEEAGVKGILR  93


4
Query  79897  PLGVWEFRSKSSQKICSLKGGCKGYMFALEVTEELEVWPEQGNRDRKWV  80043
              PLGVWEFRSKSS       GGCKGYMFAL+VTEELE WPE+ NR+R+W+
Sbjct  96     PLGVWEFRSKSSTVEDECLGGCKGYMFALKVTEELEDWPERKNRERRWL  144


5
Query  80243  LCIKEAFKLCRYEWMCRALEKFLAVMTEDRKHEMWEE  80353
              L +KEA +LCRYEWM RALE+FL VM ++R+    EE
Sbjct  144    LTVKEALELCRYEWMQRALEEFLRVMEDERRLRTEEE  180
Syntaxin-22, sp|P93654.1, +
Координаты по белкуКоординаты по ДНК
184802
6184978
6385518
8785592
9486540
14186683
16187983
21688150
Этот белок нашёлся только по Swissprot.

1
Query  84802  MSFQDLQNGAKPSSSA--GRPQNPSQAVATGIFQINTAVAAFRRLVDAIGTTKDTPDHRH  84975
              MSFQDL++G   S+    G  Q+ +QAVA+GIFQINT V+ F+RLV+ +GT KDTP+ R 
Sbjct  1      MSFQDLESGRGRSTRKFNGGRQDSTQAVASGIFQINTGVSTFQRLVNTLGTPKDTPELRE  60

Query  84976  K  84978
              K
Sbjct  61     K  61


2
Query  85518  HNTRQRIMQLVKETSAKLKSLSETD  85592
              H TR  I QLVK+TSAKLK  SETD
Sbjct  63     HKTRLHIGQLVKDTSAKLKEASETD  87


3
Query  86540  PSKRIEDAKLARDFQTTLQEFQKVQQLASERESTYSPFDPSSSMTTTY  86683
              PSK+I DAKLARDFQ  L+EFQK QQ A+ERE+TY+PF P S++ ++Y
Sbjct  94     PSKKIADAKLARDFQAVLKEFQKAQQTAAERETTYTPFVPQSALPSSY  141


4
Query  87983  RQEILLLGNEISFNEAIIDEREqgirdiqdqigqANEIFKDLAVLVHEQGVVIGKI  88150
              RQE++LL NEI+FNEA+I+EREQGI++I  QIG+ NEIFKDLAVLV++QGV+I  I
Sbjct  161    RQELVLLDNEIAFNEAVIEEREQGIQEIHQQIGEVNEIFKDLAVLVNDQGVMIDDI  216
Дата последнего обновления: 16.02.2015
Copyright © Дюгай Илья, 2014.