Программой blastn был проведен поиск последовательностей, гомологичных консенсусной последовательности участка ДНК определяемого организма, по банку nr.
Видно, что в исследуемой последовательности находится фрагмент гена гистона 3.
Первые пять находок, все с очень хорошим e-value,
принадлежат одному роду - Gammarus
(отряд Amphipoda, подотряд Senticaudata), но разным видам
(выравнивание 1,
выравнивание 5).
6-ой результат
(выравнивание 6)
- последовательность организма
Primno brevidens,
принадлежащего подотряду Hyperiidea того же отряда.
При этом identities в выравнивании определяемой последовательности
с последовательностями 5 и 6 находок отличаются всего на 1%.
Таким образом, можем предположить, что наш организм принадлежит отряду Amphipoda.
| parametres | megablast (default parametres) | blastn (default parametres) | blastn (custom parametres) |
|---|---|---|---|
| Word size | 28 | 11 | 7 |
| Match/Mismatch Scores | 1; -2 | 2; -3 | 1; -1 |
| Number of findings | 7 | 139 | 144 |
| Max e-value | 6,00E-58 | 2,00E-36 | 4,00E-43 |
megablast - 214 findings, max e-value = 8E-20 blastn (default parameters) - 351 findings, max e-value = 5E-05 blastn (custom parameters) - 355 findings, max e-value = 2E-09Чувствительные параметры опять немного улучшили качество поиска.
Score E
Sequences producing significant alignments: (Bits) Value
scaffold-17 108 1e-23
unplaced-307 102 7e-22
scaffold-105 33.9 0.51
unplaced-647 28.1 4.9
> scaffold-17
Length=2125590
Score = 108 bits (269), Expect = 1e-23, Method: Compositional matrix adjust.
Identities = 123/491 (25%), Positives = 229/491 (47%), Gaps = 63/491 (13%)
Frame = +1
Query 320 HYCPYIDTHDDEKILSYSLKPNQVFAFLRSILVRVF-PKLIWGNQRIFEIILKDLETFLK 378
YCP + DD L+ +P+ V F+R +L++VF G + + + + L
Sbjct 610900 QYCPAQSSSDDGLTLNDYSRPHDVKQFVRCVLIKVFRCNFFGGMENLNAFVDNAVGMLLN 611079
Query 379 LSRYESF-SLHYLMSNIKISEIEWLVLGKRSNAKMCLSDFEKRKQ--IFAEFIYWLYNSF 435
L ++ES +++ I+ S I WL + K+ ++ E +K + + WL N F
Sbjct 611080 LRKFESMPEASFIVKGIQSSRIMWLRSKLNT*PKV-VNKLEHQKL**LCSSLFQWLLNRF 611256
Query 436 IIPILQSFFYITESSDLRNRTVYFRKDIWKLLCRPFITSMKMEAFEKINENNVRMDTQKT 495
+ +L++ F+IT++S +NR Y+R D+W+ R ++ I+ + +T +
Sbjct 611257 VSDLLKACFFITDTSHCKNRVFYYRFDLWR---RMVEVQSSIKNLHPIDMG*I--NTGRK 611421
Query 496 TLPPAVIRLLPKKN-TFRLITNLRKRFLIKMGSNKKM--LVSTNQTLRPVASILKHLINE 552
+ + IRL+PK+N +FR I NLR + +NK M L+S + L++E
Sbjct 611422 FM--S*IRLIPKENGSFRRINNLR-----SVNNNK*MYGLLSDA*CI---------LLSE 611553
Query 553 ESSG--------IPFNLEVYMKLLTFKKDLLKHRMFGRKKYFVRIDIKSCYDRIKQDLMF 604
++ G + N ++Y +L FK G YFV+ D+ YD I + +F
Sbjct 611554 KNYG*IDLLKDIVLSNDDIYARLK*FKMRNKARF*RGD*LYFVKSDVT*AYDSINRQKLF 611733
Query 605 RIVKKKL-KDPEFVIRKYATI-------------HATSDRATKNFVSEAFSYFDMVPFEK 650
+++ D EF+I Y H S RA + F +
Sbjct 611734 SVLE*IF**DSEFIIHGY*R*LQLCLLR*F*KLYHKVSIRAE*H-----------QTFPE 611880
Query 651 VVQLLSMKTSDTLFVDFVDYWTKSSSEIFKMLKEHLSGHIVKIGNSQYLQKVGIPQG-SI 709
+ L+ ++ +F+D V S +++FK +++ + +I++ + Y+Q+ GIPQG +
Sbjct 611881 FCKELAKSIANKVFIDKV**KKVSGADVFKAIEQLIYDNILQFEDGYYVQEEGIPQGSIV 612060
Query 710 LSSFLCHFYMEDLIDEYLSFTKKKGSVLLRVVDDFLFITVNKKDAKKFLNLSLRGFEKHN 769
S Y ++E +FT++ S+L++ +DDFL++T +K A +L+ GF +
Sbjct 612061 SSLLCSLLYSHLALNELFTFTRRSDSLLIKFIDDFLYLTFDKA*A*GYLSRI*IGFPDYG 612240
Query 770 FSTSLEKTVIN 780
+ +KT N
Sbjct 612241 VHMNPKKTATN 612273
Score E
Sequences producing significant alignments: (Bits) Value
scaffold-199 920 0.0
scaffold-96 744 0.0
scaffold-423 737 0.0
unplaced-999 540 8e-171
unplaced-980 461 9e-142
scaffold-157 285 1e-81
scaffold-693 281 2e-80
unplaced-804 264 2e-74
scaffold-499 262 6e-74
unplaced-959 231 1e-63
scaffold-469 150 5e-43
scaffold-418 150 5e-43
unplaced-113 122 1e-32
scaffold-138 78.6 3e-17
scaffold-61 78.6 3e-17
unplaced-721 43.9 2e-05
Score E
Sequences producing significant alignments: (Bits) Value
unplaced-665 742 0.0
scaffold-26 693 0.0
unplaced-5 348 1e-105
scaffold-57 348 1e-105
scaffold-423 161 6e-49
Score Expect Method Identities Positives Gaps
Frame
369 bits(947) 8e-110 Compositional matrix adjust. 203/407(50%) 257/407(63%) 53/407(13%)
-3
Query 12230 KVKTAILLFNLGGPGSLSEVKPFLTRLFSDPDLIELPMSRSSLFNRILALRQESTSTIAQ 12051
K KT I+L N+GGP + +EV FL RLFSD DL+ LP AQ
Sbjct 68 KPKTGIMLLNMGGPETTNEVHDFLLRLFSDRDLMVLP---------------------AQ 106
Query 12050 SESTDSKFKGLLSDNVVKEDIPHV*KLFADVITKRRSKKIENQYQQIGGQSPIKKWTTLQ 11871
S+ A I +RR+ KI+ QYQ+IGG SPIK WT Q
Sbjct 107 SK-------------------------MAQWIARRRTPKIQEQYQKIGGGSPIKMWTEKQ 141
Query 11870 MEKMVKLLDQVSPHTAPHKPYIAFRYADPLTHDALYQAINDGAERIIGFT*YP*YSCSTT 11691
E M+KLLD + P +APHK YI FRY PLT D L Q +DG ER + FT YP YSCSTT
Sbjct 142 GEGMIKLLDDMCPDSAPHKFYIGFRYVKPLTEDTLDQMESDGIERAVAFTQYPQYSCSTT 201
Query 11690 GSSLNELATAVRRLKPELRDKLKMSFIDRWPIQKELVEAFA*NIKSKLDEFPAEDRNCVL 11511
GSSLN + ++ K E + +K S IDRWP LV+AFA N++++L +FPA+ +N V+
Sbjct 202 GSSLNAIYRHYKQ-KGE-KPGIKWSVIDRWPTHPGLVQAFAENVRAELAKFPADVQNEVV 259
Query 11510 LLFSAHSLPMSVVDRGDTYPQEVAATVQAVMERLGHSNPYRLSWQSKVGPSRWLSP*TAD 11331
+LFSAHSLPM VVDRGD YPQEVAATVQ VME L +S+PYRL WQSKVGP WL P T D
Sbjct 260 ILFSAHSLPMKVVDRGDPYPQEVAATVQRVMELLNYSHPYRLVWQSKVGPMPWLGPQTED 319
Query 11330 VVSMLGKKSHQKDKNVIIVPVAFTSDHIETLFEIDIELMED-AHKLGL-NMKRCDSLNDS 11157
+ L KK KN+++VP+AFTSDHIETL E+DIE E+ AH++G+ N++R SLNDS
Sbjct 320 SIKGLAKKG---KKNILLVPIAFTSDHIETLHELDIEYAEEVAHEVGIENIRRAASLNDS 376
Query 11156 ETFIRGMVNLVKGHIDSGFQCSQ*LHMQCPGC*KQSCRNMRETLLQQ 11016
TFI+ M ++VK H+DSG CS+ L ++CP C +C +E L +
Sbjct 377 PTFIKAMADVVKAHLDSGVNCSRQLPLRCPMCVNPTCGLAKEFFLNR 423
© Антоненкова Юлия, 2017