Поиск организма по фрагменту нуклеотидной последовательности
По заданному 300-нуклеотидному фрагменту с помощью алгоритма megablаst был найден организм, геному которого соответствует данный фрагмент. Организм: Mycoplasma leachii, AC: FR668087, фрагмент в геноме располагается в позиции с 919 по 1218 нуклеотид, фрагмент кодирует часть DnaA.Query 1 AATTATTATTCAGATGATGTTAGAAAAATTAAGGGAAGTGTTTCAAGACTAAACTTTTGG 60 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct 919 AATTATTATTCAGATGATGTTAGAAAAATTAAGGGAAGTGTTTCAAGACTAAACTTTTGG 978 Query 61 TCTCAACAAAATCCAGAAGAAAAAACTATTACTATAGAAATAATTTCTGATCTATTTAGA 120 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct 979 TCTCAACAAAATCCAGAAGAAAAAACTATTACTATAGAAATAATTTCTGATCTATTTAGA 1038 Query 121 GATATACCTACTTCAAAATTAGGTATTTTAAATGTTaaaaaaaTTAAAGAAGTTGTTAGT 180 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct 1039 GATATACCTACTTCAAAATTAGGTATTTTAAATGTTAAAAAAATTAAAGAAGTTGTTAGT 1098 Query 181 GAAAAATATGGTATTTCAGTTAATGCAATTGATGGAAAAGCTAGAAGTAAGCTAATTGTA 240 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct 1099 GAAAAATATGGTATTTCAGTTAATGCAATTGATGGAAAAGCTAGAAGTAAGCTAATTGTA 1158 Query 241 ACAGCAAGACATATAGCAATGTATTTAACAAAAGAGATTTTAAATCACACTTTAGCTCAA 300 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct 1159 ACAGCAAGACATATAGCAATGTATTTAACAAAAGAGATTTTAAATCACACTTTAGCTCAA 1218
Поиск гомолога белка человека в слоне
Для работы был выбран белок кератина 1 типа с идентификатором K1C9_HUMAN, с помощью сервиса ENA были найдены гомологи человеческого кератина у африканского слона. Чтобы искать целый белок, нужно поставить галочку в чекбоксе - spliced translated nucleotide search. E-value лучшей находки 2E-128, длина - 418, identity - 56%, координаты - с 23403559 по 23384978, количество интронов - 3. Само выравнивание:
47 : PheSerSerSerSerGlyTyrGlyGlyGlySerSerArgValCysGlyArgGly : 64 .!.!.!.!!|||.!!||| !||||||||||||||||||:!!! !..! ! ! LeuLysGlySerGlyGlyIleGlyGlyGlySerSerArgIleSerSerValLeu 23403559 : CTGAAGGGCTCTGGTGGCATCGGCGGCGGTTCCAGCCGCATCTCCTCTGTCCTG : 23403508 65 : GlyGlyGlySerPheGlyTyrSerTyrGlyGlyGlySerGlyGlyGlyPheSer : 82 !!.!||||||! ! !! ! !! !!.! !|||.!! !..!! !! !||| ThrAlaGlySerCysArgAlaProSerAlaTyrGlyGlyLeuSerValSerSer 23403507 : ACTGCAGGCTCCTGCCGGGCCCCCAGTGCCTATGGGGGCCTGTCAGTCTCCTCC : 23403454 83 : AlaSerSerLeuGlyGlyGlyPheGlyGlyGlySerArgGlyPheGlyGlyAla : 100 :!! !!! !! !..!|||||| ! !!||| !.!! !!|||!:!||||||!.! SerArgPheSerSerGlyGlyAlaCysGlyIleGlyGlyGlyTyrGlyGlyGly 23403453 : TCCCGCTTCTCCTCTGGGGGAGCCTGCGGGATAGGGGGTGGCTATGGCGGTGGC : 23403400 101 : SerGlyGlyGlyTyrSerSerSerGlyGlyPheGlyGlyGlyPheGlyGlyGly : 118 ! !.!!.!!.!! !||| ...||||||||||||||||||:::||||||||| PheSerSerSerSerSerPheGlyGlyGlyPheGlyGlyGlyTyrGlyGlyGly 23403399 : TTCAGCAGCAGCAGCAgctttggtggtggctttggtggaggatatggtggtggt : 23403346 119 : SerGlyGlyGlyPheGlyGlyGlyTyrGlySerGlyPheGlyGly<-><->Phe : 134 |||...|||||||||||||||:::|||...|||...|||||| LeuGlyAlaGlyPheGlyGlyGlyPheGlyGlyGlyLeuGlyGlyGlyLeuGly 23403345 : cttggtgctggctttggtggtggctttggtggtggcctgggtggtggcttgggt : 23403292 135 : GlyGlyPheGlyGlyGlyAlaGlyGlyGlyAspGlyGlyIleLeuThrAlaAsn : 152 |||||||||||||||||| |||||||||||| |||:!!|||..!!.!!:! GlyGlyPheGlyGlyGlyLeuGlyGlyGlyAsp---GlyLeuLeuValGlySer 23403291 : ggcggctttggtggtggcttgggtggtggcgat---ggGCTCCTAGTGGGCAGT : 23403241 153 : GluLysSerThrMetGlnGluLeuAsnSerArgLeuAlaSerTyrLeuAspLys : 170 |||||| !|||||||||.!.||||||..!|||||||||||||||||||||||| GluLysValThrMetGlnAsnLeuAsnAspArgLeuAlaSerTyrLeuAspLys 23403240 : GAGAAAGTGACCATGCAGAACCTCAACGACCGCCTGGCCTCCTACCTGGACAAG : 23403187 171 : ValGlnAlaLeuGluGluAlaAsnAsnAspLeuGluAsnLysIleGlnAspTrp : 188 |||!::|||||||||||||||||| !||||||||| ||||||!::|||||| ValArgAlaLeuGluGluAlaAsnAlaAspLeuGluValLysIleArgAspTrp 23403186 : GTGCGTGCCCTGGAGGAAGCCAACGCTGACCTGGAGGTGAAGATCCGCGACTGG : 23403133 189 : TyrAspLysLysGlyProAlaAlaIleGlnLysAsnTyrSerProTyrTyrAsn : 206 |||.!.|||:!! !!||||||! !||| |||:!!||||||||||||!:!!!. TyrGlnLysGlnArgProAlaGluIle---LysAspTyrSerProTyrPheLys 23403132 : TACCAGAAGCAGAGGCCTGCTGAAATC---AAAGACTACAGCCCCTACTTCAAG : 23403082 207 : ThrIleAspAspLeuLysAspGlnIleValAspLeuThrValGlyAsn<->Asn : 223 ||||||!!:||||||!:!:!!:!!:!! !! ||| !..!|||!.. :!! ThrIleGluAspLeuArgAsnLysValCysGlyLeuAspThrGlyArgCysHis 23403081 : ACCATCGAGGACCTGAGGAACAAGGTTTGTGGACTGGACACTGGGAGGTGCCAT : 23403028 224 : LysThrLeuLeuAspIle >>>> Target Intron 1 >>>> AspAsnT : 232 !:!! !||| !:!: 1789 bp :!!... ProSerTyrLeuProLeu+- ++AsnGlyC 23403027 : CCCAGCTACCTCCCTCTGgc.........................agAATGGGT : 23401212 233 : hrArgMetThrLeuAspAspPheArgIleLysPheGluMetGluGlnAsnLeuA : 250 !! !!!::!!||| !!.!:!!!:!!:!|||! |||! !||||||| ysLeuIleSerLeuLeuLeuGlyHisLeuArgTyrGluThrGluLeuAsnLeuA 23401211 : GTCTCATTTCTCTTCTGCTGGGTCATCTCAGGTATGAGACAGAGCTGAACCTGC : 23401158 251 : rgGlnGlyValAspAlaAspIleAsnGlyLeuArgGlnValLeuAspAsnLeuT : 268 ||..!.!!|||!!:|||||||||||||||||||||::!|||||||||.!.|||| rgMetSerValGluAlaAspIleAsnGlyLeuArgArgValLeuAspGluLeuT 23401157 : GCATGAGTGTGGAGGCCGACATCAACGGCCTGCGCAGGGTGTTGGACGAGCTGA : 23401104 269 : hrMetGluLysSerAspLeuGluMetGlnTyrGluThrLeuGlnGluGluLeuM : 286 ||:!!! !:!!!!||||||||||||||| !|||!:!|||:!!|||||||||: hrLeuAlaArgThrAspLeuGluMetGlnIleGluSerLeuLysGluGluLeuV 23401103 : CCCTGGCCAGGACTGACCTGGAGATGCAGATTGAGAGCCTGAAGGAGGAGCTGG : 23401050 287 : etAlaLeuLysLysAsnHisLysGlu >>>> Target Intron 2 >>>> : 295 !: !:!!!:!|||||||||:!!||| 14603 bp alTyrMetArgLysAsnHisGluGlu++ + 23401049 : TCTACATGAGGAAGAACCATGAGGAGgt.........................a : 23386422 296 : GluMetSerGlnLeuThrGlyGlnAsnSerGlyAspValAsnValGluIleAs : 312 |||||||||||||||||||||||||||||||||||||||!:!||||||!!:|| +GluMetSerGlnLeuThrGlyGlnAsnSerGlyAspValSerValGluMetAs 23386421 : gGAGATGAGCCAGCTGACTGGGCAGAACTCTGGGGATGTCAGTGTGGAGATGAA : 23386369 313 : nValAlaProGlyLysAspLeuThrLysThrLeuAsnAspMetArgGlnGluTy : 330 |!.!|||||||||! !||||||||||||..!||||||||||||!.!|||||||| nAlaAlaProGlyIleAspLeuThrLysValLeuAsnAspMetHisGlnGluTy 23386368 : TGCTGCTCCTGGCATAGATCTCACCAAAGTCCTTAATGACATGCACCAGGAGTA : 23386315 331 : rGluGlnLeuIleAlaLysAsnArgLysAspIleGluAsnGlnTyrGluThrGl : 348 |||||||:!!||||||||||||||||||!!:||||||.!. ! |||!!:||||| rGluGlnIleIleAlaLysAsnArgLysGluIleGluGluTyrTyrAspThrGl 23386314 : TGAGCAGATCATTGCTAAGAACCGTAAGGAAATTGAGGAATACTATGACACTCA : 23386261 349 : n >>>> Target Intron 3 >>>> IleThrGlnIleGluHisGluVal : 356 | 927 bp ! ! !!:!:!:... !.!.||| n++ ++SerTrpArgLeuSerCysAsnVal 23386260 : Ggt.........................agAGTTGGCGATTGAGCTGCAATGTC : 23385310 357 : SerSerSerGlyGlnGluVal<-><->GlnSerSerAlaLysGluValThrGln : 372 ||||||:!! !! !! !||| |||:!!!!!..!:!!! ! !.!!||| SerSerAlaTrpLeuValValLeuLeuGlnAlaCysCysGlnGlyGlyAlaGln 23385309 : AGCTCAGCATGGTTGGTAGTCCTGCTCCAGGCCTGCTGCCAGGGTGGGGCACAG : 23385256 373 : LeuArgHisGlyValGlnGluLeuGluIleGluLeuGlnSerGlnLeuSerLys : 390 !|||...|||!.! ! ! !.!. !...! ! ! |||! :!! ! !! GlyArgArgGlyAlaThrIleGluHisProSer***TyrSerProIleLeu*** 23385255 : GGAAGGAGAGGAGCGACGATAGAACACCCCTCTTAGTATTCTCCCATTCTCTAG : 23385202 391 : LysAlaAlaLeuGluLysSerLeuGluAspThrLysAsnArgTyrCysGlyGln : 408 |||:!!||||||||||||!!!|||||||||.!!|||||||||||| !!|||||| LysSerAlaLeuGluLysThrLeuGluAspAlaLysAsnArgTyrGlyGlyGln 23385201 : AAATCTGCCCTGGAGAAGACCTTGGAAGACGCCAAGAACCGCTACGGTGGCCAG : 23385148 409 : LeuGlnMetIleGlnGluGlnIleSerAsnLeuGluAlaGlnIleThrAspVal : 426 |||||| ||||||||||||||||||:!!||||||||||||:!!|||!!::!! LeuGlnHisIleGlnGluGlnIleSerHisLeuGluAlaGlnLeuThrGluIle 23385147 : CTGCAGCACATCCAGGAGCAGATCAGTCACCTGGAGGCCCAGCTCACAGAGATT : 23385094 427 : ArgGlnGluIleGluCysGlnAsnGlnGluTyrSerLeuLeuLeuSerIleLys : 444 !! !||||||:!!||||||||||||||||||||||||:!!||||||! !||| GlyValGluIleGlnCysGlnAsnGlnGluTyrSerLeuMetLeuSerThrLys 23385093 : GGGGTGGAGATCCAGTGCCAGAACCAGGAATACAGCCTTATGCTCAGCACCAAA : 23385040 445 : MetArgLeuGluLysGluIleGluThrTyrHisAsnLeuLeuGluGlyGlyGln : 462 ! |||||||||:!!|||||||||||||||!.!!:!|||||||||||||||||| ThrArgLeuGluGlnGluIleGluThrTyrArgSerLeuLeuGluGlyGlyGln 23385039 : ACACGGCTGGAGCAGGAAATTGAGACCTACCGCAGCCTCCTTGAGGGTGGCCAG : 23384986 463 : GluAsp : 464 |||||| GluAsp 23384985 : GAGGAC : 23384978
Поиск некодирующих последовательностей программой BLAST
Бактерия Thermomonospora curvata относится к порядку Actinomycetales. Для работы взята некодирующая часть генома с 72822 по 72904 нуклеотид, тРНК Лей. С помощью алгоритма megablast с e-value <0.001 - 53 находки, blastn - 250, blastn с параметрами длиной слова = 7, match/mismatch = 1/-1 - 258. Алгоритм megablast позволил найти последовательности с минимальным e-value 10^-16, причем достаточно много результатов, поэтому он хорош для нахождения близких гомологов. Стоит заметить, что blastn с расширенными параметрами дал немногим больше результатов,чем просто blastn, следовательно, можно предположить, что есть некоторая доля случайных совпадений в процессе выравнивания.