Поиск организма по фрагменту нуклеотидной последовательности
По заданному 300-нуклеотидному фрагменту с помощью алгоритма megablаst был найден организм, геному которого соответствует данный фрагмент. Организм: Mycoplasma leachii, AC: FR668087, фрагмент в геноме располагается в позиции с 919 по 1218 нуклеотид, фрагмент кодирует часть DnaA.
Query 1 AATTATTATTCAGATGATGTTAGAAAAATTAAGGGAAGTGTTTCAAGACTAAACTTTTGG 60
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 919 AATTATTATTCAGATGATGTTAGAAAAATTAAGGGAAGTGTTTCAAGACTAAACTTTTGG 978
Query 61 TCTCAACAAAATCCAGAAGAAAAAACTATTACTATAGAAATAATTTCTGATCTATTTAGA 120
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 979 TCTCAACAAAATCCAGAAGAAAAAACTATTACTATAGAAATAATTTCTGATCTATTTAGA 1038
Query 121 GATATACCTACTTCAAAATTAGGTATTTTAAATGTTaaaaaaaTTAAAGAAGTTGTTAGT 180
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1039 GATATACCTACTTCAAAATTAGGTATTTTAAATGTTAAAAAAATTAAAGAAGTTGTTAGT 1098
Query 181 GAAAAATATGGTATTTCAGTTAATGCAATTGATGGAAAAGCTAGAAGTAAGCTAATTGTA 240
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1099 GAAAAATATGGTATTTCAGTTAATGCAATTGATGGAAAAGCTAGAAGTAAGCTAATTGTA 1158
Query 241 ACAGCAAGACATATAGCAATGTATTTAACAAAAGAGATTTTAAATCACACTTTAGCTCAA 300
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1159 ACAGCAAGACATATAGCAATGTATTTAACAAAAGAGATTTTAAATCACACTTTAGCTCAA 1218
Поиск гомолога белка человека в слоне
Для работы был выбран белок кератина 1 типа с идентификатором K1C9_HUMAN, с помощью сервиса ENA были найдены гомологи человеческого кератина у африканского слона. Чтобы искать целый белок, нужно поставить галочку в чекбоксе - spliced translated nucleotide search. E-value лучшей находки 2E-128, длина - 418, identity - 56%, координаты - с 23403559 по 23384978, количество интронов - 3. Само выравнивание:
47 : PheSerSerSerSerGlyTyrGlyGlyGlySerSerArgValCysGlyArgGly : 64
.!.!.!.!!|||.!!||| !||||||||||||||||||:!!! !..! ! !
LeuLysGlySerGlyGlyIleGlyGlyGlySerSerArgIleSerSerValLeu
23403559 : CTGAAGGGCTCTGGTGGCATCGGCGGCGGTTCCAGCCGCATCTCCTCTGTCCTG : 23403508
65 : GlyGlyGlySerPheGlyTyrSerTyrGlyGlyGlySerGlyGlyGlyPheSer : 82
!!.!||||||! ! !! ! !! !!.! !|||.!! !..!! !! !|||
ThrAlaGlySerCysArgAlaProSerAlaTyrGlyGlyLeuSerValSerSer
23403507 : ACTGCAGGCTCCTGCCGGGCCCCCAGTGCCTATGGGGGCCTGTCAGTCTCCTCC : 23403454
83 : AlaSerSerLeuGlyGlyGlyPheGlyGlyGlySerArgGlyPheGlyGlyAla : 100
:!! !!! !! !..!|||||| ! !!||| !.!! !!|||!:!||||||!.!
SerArgPheSerSerGlyGlyAlaCysGlyIleGlyGlyGlyTyrGlyGlyGly
23403453 : TCCCGCTTCTCCTCTGGGGGAGCCTGCGGGATAGGGGGTGGCTATGGCGGTGGC : 23403400
101 : SerGlyGlyGlyTyrSerSerSerGlyGlyPheGlyGlyGlyPheGlyGlyGly : 118
! !.!!.!!.!! !||| ...||||||||||||||||||:::|||||||||
PheSerSerSerSerSerPheGlyGlyGlyPheGlyGlyGlyTyrGlyGlyGly
23403399 : TTCAGCAGCAGCAGCAgctttggtggtggctttggtggaggatatggtggtggt : 23403346
119 : SerGlyGlyGlyPheGlyGlyGlyTyrGlySerGlyPheGlyGly<-><->Phe : 134
|||...|||||||||||||||:::|||...|||...||||||
LeuGlyAlaGlyPheGlyGlyGlyPheGlyGlyGlyLeuGlyGlyGlyLeuGly
23403345 : cttggtgctggctttggtggtggctttggtggtggcctgggtggtggcttgggt : 23403292
135 : GlyGlyPheGlyGlyGlyAlaGlyGlyGlyAspGlyGlyIleLeuThrAlaAsn : 152
|||||||||||||||||| |||||||||||| |||:!!|||..!!.!!:!
GlyGlyPheGlyGlyGlyLeuGlyGlyGlyAsp---GlyLeuLeuValGlySer
23403291 : ggcggctttggtggtggcttgggtggtggcgat---ggGCTCCTAGTGGGCAGT : 23403241
153 : GluLysSerThrMetGlnGluLeuAsnSerArgLeuAlaSerTyrLeuAspLys : 170
|||||| !|||||||||.!.||||||..!||||||||||||||||||||||||
GluLysValThrMetGlnAsnLeuAsnAspArgLeuAlaSerTyrLeuAspLys
23403240 : GAGAAAGTGACCATGCAGAACCTCAACGACCGCCTGGCCTCCTACCTGGACAAG : 23403187
171 : ValGlnAlaLeuGluGluAlaAsnAsnAspLeuGluAsnLysIleGlnAspTrp : 188
|||!::|||||||||||||||||| !||||||||| ||||||!::||||||
ValArgAlaLeuGluGluAlaAsnAlaAspLeuGluValLysIleArgAspTrp
23403186 : GTGCGTGCCCTGGAGGAAGCCAACGCTGACCTGGAGGTGAAGATCCGCGACTGG : 23403133
189 : TyrAspLysLysGlyProAlaAlaIleGlnLysAsnTyrSerProTyrTyrAsn : 206
|||.!.|||:!! !!||||||! !||| |||:!!||||||||||||!:!!!.
TyrGlnLysGlnArgProAlaGluIle---LysAspTyrSerProTyrPheLys
23403132 : TACCAGAAGCAGAGGCCTGCTGAAATC---AAAGACTACAGCCCCTACTTCAAG : 23403082
207 : ThrIleAspAspLeuLysAspGlnIleValAspLeuThrValGlyAsn<->Asn : 223
||||||!!:||||||!:!:!!:!!:!! !! ||| !..!|||!.. :!!
ThrIleGluAspLeuArgAsnLysValCysGlyLeuAspThrGlyArgCysHis
23403081 : ACCATCGAGGACCTGAGGAACAAGGTTTGTGGACTGGACACTGGGAGGTGCCAT : 23403028
224 : LysThrLeuLeuAspIle >>>> Target Intron 1 >>>> AspAsnT : 232
!:!! !||| !:!: 1789 bp :!!...
ProSerTyrLeuProLeu+- ++AsnGlyC
23403027 : CCCAGCTACCTCCCTCTGgc.........................agAATGGGT : 23401212
233 : hrArgMetThrLeuAspAspPheArgIleLysPheGluMetGluGlnAsnLeuA : 250
!! !!!::!!||| !!.!:!!!:!!:!|||! |||! !|||||||
ysLeuIleSerLeuLeuLeuGlyHisLeuArgTyrGluThrGluLeuAsnLeuA
23401211 : GTCTCATTTCTCTTCTGCTGGGTCATCTCAGGTATGAGACAGAGCTGAACCTGC : 23401158
251 : rgGlnGlyValAspAlaAspIleAsnGlyLeuArgGlnValLeuAspAsnLeuT : 268
||..!.!!|||!!:|||||||||||||||||||||::!|||||||||.!.||||
rgMetSerValGluAlaAspIleAsnGlyLeuArgArgValLeuAspGluLeuT
23401157 : GCATGAGTGTGGAGGCCGACATCAACGGCCTGCGCAGGGTGTTGGACGAGCTGA : 23401104
269 : hrMetGluLysSerAspLeuGluMetGlnTyrGluThrLeuGlnGluGluLeuM : 286
||:!!! !:!!!!||||||||||||||| !|||!:!|||:!!|||||||||:
hrLeuAlaArgThrAspLeuGluMetGlnIleGluSerLeuLysGluGluLeuV
23401103 : CCCTGGCCAGGACTGACCTGGAGATGCAGATTGAGAGCCTGAAGGAGGAGCTGG : 23401050
287 : etAlaLeuLysLysAsnHisLysGlu >>>> Target Intron 2 >>>> : 295
!: !:!!!:!|||||||||:!!||| 14603 bp
alTyrMetArgLysAsnHisGluGlu++ +
23401049 : TCTACATGAGGAAGAACCATGAGGAGgt.........................a : 23386422
296 : GluMetSerGlnLeuThrGlyGlnAsnSerGlyAspValAsnValGluIleAs : 312
|||||||||||||||||||||||||||||||||||||||!:!||||||!!:||
+GluMetSerGlnLeuThrGlyGlnAsnSerGlyAspValSerValGluMetAs
23386421 : gGAGATGAGCCAGCTGACTGGGCAGAACTCTGGGGATGTCAGTGTGGAGATGAA : 23386369
313 : nValAlaProGlyLysAspLeuThrLysThrLeuAsnAspMetArgGlnGluTy : 330
|!.!|||||||||! !||||||||||||..!||||||||||||!.!||||||||
nAlaAlaProGlyIleAspLeuThrLysValLeuAsnAspMetHisGlnGluTy
23386368 : TGCTGCTCCTGGCATAGATCTCACCAAAGTCCTTAATGACATGCACCAGGAGTA : 23386315
331 : rGluGlnLeuIleAlaLysAsnArgLysAspIleGluAsnGlnTyrGluThrGl : 348
|||||||:!!||||||||||||||||||!!:||||||.!. ! |||!!:|||||
rGluGlnIleIleAlaLysAsnArgLysGluIleGluGluTyrTyrAspThrGl
23386314 : TGAGCAGATCATTGCTAAGAACCGTAAGGAAATTGAGGAATACTATGACACTCA : 23386261
349 : n >>>> Target Intron 3 >>>> IleThrGlnIleGluHisGluVal : 356
| 927 bp ! ! !!:!:!:... !.!.|||
n++ ++SerTrpArgLeuSerCysAsnVal
23386260 : Ggt.........................agAGTTGGCGATTGAGCTGCAATGTC : 23385310
357 : SerSerSerGlyGlnGluVal<-><->GlnSerSerAlaLysGluValThrGln : 372
||||||:!! !! !! !||| |||:!!!!!..!:!!! ! !.!!|||
SerSerAlaTrpLeuValValLeuLeuGlnAlaCysCysGlnGlyGlyAlaGln
23385309 : AGCTCAGCATGGTTGGTAGTCCTGCTCCAGGCCTGCTGCCAGGGTGGGGCACAG : 23385256
373 : LeuArgHisGlyValGlnGluLeuGluIleGluLeuGlnSerGlnLeuSerLys : 390
!|||...|||!.! ! ! !.!. !...! ! ! |||! :!! ! !!
GlyArgArgGlyAlaThrIleGluHisProSer***TyrSerProIleLeu***
23385255 : GGAAGGAGAGGAGCGACGATAGAACACCCCTCTTAGTATTCTCCCATTCTCTAG : 23385202
391 : LysAlaAlaLeuGluLysSerLeuGluAspThrLysAsnArgTyrCysGlyGln : 408
|||:!!||||||||||||!!!|||||||||.!!|||||||||||| !!||||||
LysSerAlaLeuGluLysThrLeuGluAspAlaLysAsnArgTyrGlyGlyGln
23385201 : AAATCTGCCCTGGAGAAGACCTTGGAAGACGCCAAGAACCGCTACGGTGGCCAG : 23385148
409 : LeuGlnMetIleGlnGluGlnIleSerAsnLeuGluAlaGlnIleThrAspVal : 426
|||||| ||||||||||||||||||:!!||||||||||||:!!|||!!::!!
LeuGlnHisIleGlnGluGlnIleSerHisLeuGluAlaGlnLeuThrGluIle
23385147 : CTGCAGCACATCCAGGAGCAGATCAGTCACCTGGAGGCCCAGCTCACAGAGATT : 23385094
427 : ArgGlnGluIleGluCysGlnAsnGlnGluTyrSerLeuLeuLeuSerIleLys : 444
!! !||||||:!!||||||||||||||||||||||||:!!||||||! !|||
GlyValGluIleGlnCysGlnAsnGlnGluTyrSerLeuMetLeuSerThrLys
23385093 : GGGGTGGAGATCCAGTGCCAGAACCAGGAATACAGCCTTATGCTCAGCACCAAA : 23385040
445 : MetArgLeuGluLysGluIleGluThrTyrHisAsnLeuLeuGluGlyGlyGln : 462
! |||||||||:!!|||||||||||||||!.!!:!||||||||||||||||||
ThrArgLeuGluGlnGluIleGluThrTyrArgSerLeuLeuGluGlyGlyGln
23385039 : ACACGGCTGGAGCAGGAAATTGAGACCTACCGCAGCCTCCTTGAGGGTGGCCAG : 23384986
463 : GluAsp : 464
||||||
GluAsp
23384985 : GAGGAC : 23384978
Поиск некодирующих последовательностей программой BLAST
Бактерия Thermomonospora curvata относится к порядку Actinomycetales. Для работы взята некодирующая часть генома с 72822 по 72904 нуклеотид, тРНК Лей. С помощью алгоритма megablast с e-value <0.001 - 53 находки, blastn - 250, blastn с параметрами длиной слова = 7, match/mismatch = 1/-1 - 258. Алгоритм megablast позволил найти последовательности с минимальным e-value 10^-16, причем достаточно много результатов, поэтому он хорош для нахождения близких гомологов. Стоит заметить, что blastn с расширенными параметрами дал немногим больше результатов,чем просто blastn, следовательно, можно предположить, что есть некоторая доля случайных совпадений в процессе выравнивания.
Вконтакте
allakarpova@kodomo.fbb.msu.ru
vseokeyboss@gmail.com