vkВконтакте
kodomoallakarpova@kodomo.fbb.msu.ru
GMailvseokeyboss@gmail.com
Учебный сайт
   Карповой Аллы
Онлайн BLAST



Поиск организма по фрагменту нуклеотидной последовательности

По заданному 300-нуклеотидному фрагменту с помощью алгоритма megablаst был найден организм, геному которого соответствует данный фрагмент. Организм: Mycoplasma leachii, AC: FR668087, фрагмент в геноме располагается в позиции с 919 по 1218 нуклеотид, фрагмент кодирует часть DnaA.
Query  1     AATTATTATTCAGATGATGTTAGAAAAATTAAGGGAAGTGTTTCAAGACTAAACTTTTGG  60
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  919   AATTATTATTCAGATGATGTTAGAAAAATTAAGGGAAGTGTTTCAAGACTAAACTTTTGG  978

Query  61    TCTCAACAAAATCCAGAAGAAAAAACTATTACTATAGAAATAATTTCTGATCTATTTAGA  120
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  979   TCTCAACAAAATCCAGAAGAAAAAACTATTACTATAGAAATAATTTCTGATCTATTTAGA  1038

Query  121   GATATACCTACTTCAAAATTAGGTATTTTAAATGTTaaaaaaaTTAAAGAAGTTGTTAGT  180
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1039  GATATACCTACTTCAAAATTAGGTATTTTAAATGTTAAAAAAATTAAAGAAGTTGTTAGT  1098

Query  181   GAAAAATATGGTATTTCAGTTAATGCAATTGATGGAAAAGCTAGAAGTAAGCTAATTGTA  240
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1099  GAAAAATATGGTATTTCAGTTAATGCAATTGATGGAAAAGCTAGAAGTAAGCTAATTGTA  1158

Query  241   ACAGCAAGACATATAGCAATGTATTTAACAAAAGAGATTTTAAATCACACTTTAGCTCAA  300
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1159  ACAGCAAGACATATAGCAATGTATTTAACAAAAGAGATTTTAAATCACACTTTAGCTCAA  1218
		  

Поиск гомолога белка человека в слоне

Для работы был выбран белок кератина 1 типа с идентификатором K1C9_HUMAN, с помощью сервиса ENA были найдены гомологи человеческого кератина у африканского слона. Чтобы искать целый белок, нужно поставить галочку в чекбоксе - spliced translated nucleotide search. E-value лучшей находки 2E-128, длина - 418, identity - 56%, координаты - с 23403559 по 23384978, количество интронов - 3. Само выравнивание:

       47 : PheSerSerSerSerGlyTyrGlyGlyGlySerSerArgValCysGlyArgGly :       64
            .!.!.!.!!|||.!!|||  !||||||||||||||||||:!!! !..!  !  !
            LeuLysGlySerGlyGlyIleGlyGlyGlySerSerArgIleSerSerValLeu
 23403559 : CTGAAGGGCTCTGGTGGCATCGGCGGCGGTTCCAGCCGCATCTCCTCTGTCCTG : 23403508

       65 : GlyGlyGlySerPheGlyTyrSerTyrGlyGlyGlySerGlyGlyGlyPheSer :       82
              !!.!||||||! ! !!  ! !!  !!.!  !|||.!!  !..!! !! !|||
            ThrAlaGlySerCysArgAlaProSerAlaTyrGlyGlyLeuSerValSerSer
 23403507 : ACTGCAGGCTCCTGCCGGGCCCCCAGTGCCTATGGGGGCCTGTCAGTCTCCTCC : 23403454

       83 : AlaSerSerLeuGlyGlyGlyPheGlyGlyGlySerArgGlyPheGlyGlyAla :      100
            :!! !!! !! !..!||||||  ! !!|||  !.!! !!|||!:!||||||!.!
            SerArgPheSerSerGlyGlyAlaCysGlyIleGlyGlyGlyTyrGlyGlyGly
 23403453 : TCCCGCTTCTCCTCTGGGGGAGCCTGCGGGATAGGGGGTGGCTATGGCGGTGGC : 23403400

      101 : SerGlyGlyGlyTyrSerSerSerGlyGlyPheGlyGlyGlyPheGlyGlyGly :      118
            ! !.!!.!!.!!  !|||   ...||||||||||||||||||:::|||||||||
            PheSerSerSerSerSerPheGlyGlyGlyPheGlyGlyGlyTyrGlyGlyGly
 23403399 : TTCAGCAGCAGCAGCAgctttggtggtggctttggtggaggatatggtggtggt : 23403346

      119 : SerGlyGlyGlyPheGlyGlyGlyTyrGlySerGlyPheGlyGly<-><->Phe :      134
               |||...|||||||||||||||:::|||...|||...||||||         
            LeuGlyAlaGlyPheGlyGlyGlyPheGlyGlyGlyLeuGlyGlyGlyLeuGly
 23403345 : cttggtgctggctttggtggtggctttggtggtggcctgggtggtggcttgggt : 23403292

      135 : GlyGlyPheGlyGlyGlyAlaGlyGlyGlyAspGlyGlyIleLeuThrAlaAsn :      152
            ||||||||||||||||||   ||||||||||||   |||:!!|||..!!.!!:!
            GlyGlyPheGlyGlyGlyLeuGlyGlyGlyAsp---GlyLeuLeuValGlySer
 23403291 : ggcggctttggtggtggcttgggtggtggcgat---ggGCTCCTAGTGGGCAGT : 23403241

      153 : GluLysSerThrMetGlnGluLeuAsnSerArgLeuAlaSerTyrLeuAspLys :      170
            ||||||  !|||||||||.!.||||||..!||||||||||||||||||||||||
            GluLysValThrMetGlnAsnLeuAsnAspArgLeuAlaSerTyrLeuAspLys
 23403240 : GAGAAAGTGACCATGCAGAACCTCAACGACCGCCTGGCCTCCTACCTGGACAAG : 23403187

      171 : ValGlnAlaLeuGluGluAlaAsnAsnAspLeuGluAsnLysIleGlnAspTrp :      188
            |||!::||||||||||||||||||  !|||||||||   ||||||!::||||||
            ValArgAlaLeuGluGluAlaAsnAlaAspLeuGluValLysIleArgAspTrp
 23403186 : GTGCGTGCCCTGGAGGAAGCCAACGCTGACCTGGAGGTGAAGATCCGCGACTGG : 23403133

      189 : TyrAspLysLysGlyProAlaAlaIleGlnLysAsnTyrSerProTyrTyrAsn :      206
            |||.!.|||:!! !!||||||! !|||   |||:!!||||||||||||!:!!!.
            TyrGlnLysGlnArgProAlaGluIle---LysAspTyrSerProTyrPheLys
 23403132 : TACCAGAAGCAGAGGCCTGCTGAAATC---AAAGACTACAGCCCCTACTTCAAG : 23403082

      207 : ThrIleAspAspLeuLysAspGlnIleValAspLeuThrValGlyAsn<->Asn :      223
            ||||||!!:||||||!:!:!!:!!:!!  !!  |||  !..!|||!..   :!!
            ThrIleGluAspLeuArgAsnLysValCysGlyLeuAspThrGlyArgCysHis
 23403081 : ACCATCGAGGACCTGAGGAACAAGGTTTGTGGACTGGACACTGGGAGGTGCCAT : 23403028

      224 : LysThrLeuLeuAspIle  >>>> Target Intron 1 >>>>  AspAsnT :      232
               !:!! !|||  !:!:           1789 bp           :!!... 
            ProSerTyrLeuProLeu+-                         ++AsnGlyC
 23403027 : CCCAGCTACCTCCCTCTGgc.........................agAATGGGT : 23401212

      233 : hrArgMetThrLeuAspAspPheArgIleLysPheGluMetGluGlnAsnLeuA :      250
             !! !!!::!!|||        !!.!:!!!:!!:!|||!  |||! !|||||||
            ysLeuIleSerLeuLeuLeuGlyHisLeuArgTyrGluThrGluLeuAsnLeuA
 23401211 : GTCTCATTTCTCTTCTGCTGGGTCATCTCAGGTATGAGACAGAGCTGAACCTGC : 23401158

      251 : rgGlnGlyValAspAlaAspIleAsnGlyLeuArgGlnValLeuAspAsnLeuT :      268
            ||..!.!!|||!!:|||||||||||||||||||||::!|||||||||.!.||||
            rgMetSerValGluAlaAspIleAsnGlyLeuArgArgValLeuAspGluLeuT
 23401157 : GCATGAGTGTGGAGGCCGACATCAACGGCCTGCGCAGGGTGTTGGACGAGCTGA : 23401104

      269 : hrMetGluLysSerAspLeuGluMetGlnTyrGluThrLeuGlnGluGluLeuM :      286
            ||:!!!  !:!!!!|||||||||||||||  !|||!:!|||:!!|||||||||:
            hrLeuAlaArgThrAspLeuGluMetGlnIleGluSerLeuLysGluGluLeuV
 23401103 : CCCTGGCCAGGACTGACCTGGAGATGCAGATTGAGAGCCTGAAGGAGGAGCTGG : 23401050

      287 : etAlaLeuLysLysAsnHisLysGlu  >>>> Target Intron 2 >>>>  :      295
            !:  !:!!!:!|||||||||:!!|||           14603 bp         
            alTyrMetArgLysAsnHisGluGlu++                         +
 23401049 : TCTACATGAGGAAGAACCATGAGGAGgt.........................a : 23386422

      296 :  GluMetSerGlnLeuThrGlyGlnAsnSerGlyAspValAsnValGluIleAs :      312
             |||||||||||||||||||||||||||||||||||||||!:!||||||!!:||
            +GluMetSerGlnLeuThrGlyGlnAsnSerGlyAspValSerValGluMetAs
 23386421 : gGAGATGAGCCAGCTGACTGGGCAGAACTCTGGGGATGTCAGTGTGGAGATGAA : 23386369

      313 : nValAlaProGlyLysAspLeuThrLysThrLeuAsnAspMetArgGlnGluTy :      330
            |!.!|||||||||! !||||||||||||..!||||||||||||!.!||||||||
            nAlaAlaProGlyIleAspLeuThrLysValLeuAsnAspMetHisGlnGluTy
 23386368 : TGCTGCTCCTGGCATAGATCTCACCAAAGTCCTTAATGACATGCACCAGGAGTA : 23386315

      331 : rGluGlnLeuIleAlaLysAsnArgLysAspIleGluAsnGlnTyrGluThrGl :      348
            |||||||:!!||||||||||||||||||!!:||||||.!. ! |||!!:|||||
            rGluGlnIleIleAlaLysAsnArgLysGluIleGluGluTyrTyrAspThrGl
 23386314 : TGAGCAGATCATTGCTAAGAACCGTAAGGAAATTGAGGAATACTATGACACTCA : 23386261

      349 : n  >>>> Target Intron 3 >>>>  IleThrGlnIleGluHisGluVal :      356
            |            927 bp           ! !  !!:!:!:...  !.!.|||
            n++                         ++SerTrpArgLeuSerCysAsnVal
 23386260 : Ggt.........................agAGTTGGCGATTGAGCTGCAATGTC : 23385310

      357 : SerSerSerGlyGlnGluVal<-><->GlnSerSerAlaLysGluValThrGln :      372
            ||||||:!! !!  !! !|||      |||:!!!!!..!:!!!  ! !.!!|||
            SerSerAlaTrpLeuValValLeuLeuGlnAlaCysCysGlnGlyGlyAlaGln
 23385309 : AGCTCAGCATGGTTGGTAGTCCTGCTCCAGGCCTGCTGCCAGGGTGGGGCACAG : 23385256

      373 : LeuArgHisGlyValGlnGluLeuGluIleGluLeuGlnSerGlnLeuSerLys :      390
              !|||...|||!.!  !  !  !.!.  !...! ! ! |||!  :!!  ! !!
            GlyArgArgGlyAlaThrIleGluHisProSer***TyrSerProIleLeu***
 23385255 : GGAAGGAGAGGAGCGACGATAGAACACCCCTCTTAGTATTCTCCCATTCTCTAG : 23385202

      391 : LysAlaAlaLeuGluLysSerLeuGluAspThrLysAsnArgTyrCysGlyGln :      408
            |||:!!||||||||||||!!!|||||||||.!!|||||||||||| !!||||||
            LysSerAlaLeuGluLysThrLeuGluAspAlaLysAsnArgTyrGlyGlyGln
 23385201 : AAATCTGCCCTGGAGAAGACCTTGGAAGACGCCAAGAACCGCTACGGTGGCCAG : 23385148

      409 : LeuGlnMetIleGlnGluGlnIleSerAsnLeuGluAlaGlnIleThrAspVal :      426
            ||||||   ||||||||||||||||||:!!||||||||||||:!!|||!!::!!
            LeuGlnHisIleGlnGluGlnIleSerHisLeuGluAlaGlnLeuThrGluIle
 23385147 : CTGCAGCACATCCAGGAGCAGATCAGTCACCTGGAGGCCCAGCTCACAGAGATT : 23385094

      427 : ArgGlnGluIleGluCysGlnAsnGlnGluTyrSerLeuLeuLeuSerIleLys :      444
             !!  !||||||:!!||||||||||||||||||||||||:!!||||||! !|||
            GlyValGluIleGlnCysGlnAsnGlnGluTyrSerLeuMetLeuSerThrLys
 23385093 : GGGGTGGAGATCCAGTGCCAGAACCAGGAATACAGCCTTATGCTCAGCACCAAA : 23385040

      445 : MetArgLeuGluLysGluIleGluThrTyrHisAsnLeuLeuGluGlyGlyGln :      462
            !  |||||||||:!!|||||||||||||||!.!!:!||||||||||||||||||
            ThrArgLeuGluGlnGluIleGluThrTyrArgSerLeuLeuGluGlyGlyGln
 23385039 : ACACGGCTGGAGCAGGAAATTGAGACCTACCGCAGCCTCCTTGAGGGTGGCCAG : 23384986

      463 : GluAsp :      464
            ||||||
            GluAsp
 23384985 : GAGGAC : 23384978		  
		  

Поиск некодирующих последовательностей программой BLAST

Бактерия Thermomonospora curvata относится к порядку Actinomycetales. Для работы взята некодирующая часть генома с 72822 по 72904 нуклеотид, тРНК Лей. С помощью алгоритма megablast с e-value <0.001 - 53 находки, blastn - 250, blastn с параметрами длиной слова = 7, match/mismatch = 1/-1 - 258. Алгоритм megablast позволил найти последовательности с минимальным e-value 10^-16, причем достаточно много результатов, поэтому он хорош для нахождения близких гомологов. Стоит заметить, что blastn с расширенными параметрами дал немногим больше результатов,чем просто blastn, следовательно, можно предположить, что есть некоторая доля случайных совпадений в процессе выравнивания.


© Алла Карпова

Дата последнего редактирования: 16.09.2013

Valid HTML 4.01 Transitional Правильный CSS!