Программой blastn был проведен поиск последовательностей, гомологичных консенсусной последовательности участка ДНК определяемого организма, по банку nr.
Видно, что в исследуемой последовательности находится фрагмент гена гистона 3.
Первые пять находок, все с очень хорошим e-value,
принадлежат одному роду - Gammarus
(отряд Amphipoda, подотряд Senticaudata), но разным видам
(выравнивание 1,
выравнивание 5).
6-ой результат
(выравнивание 6)
- последовательность организма
Primno brevidens,
принадлежащего подотряду Hyperiidea того же отряда.
При этом identities в выравнивании определяемой последовательности
с последовательностями 5 и 6 находок отличаются всего на 1%.
Таким образом, можем предположить, что наш организм принадлежит отряду Amphipoda.
parametres | megablast (default parametres) | blastn (default parametres) | blastn (custom parametres) |
---|---|---|---|
Word size | 28 | 11 | 7 |
Match/Mismatch Scores | 1; -2 | 2; -3 | 1; -1 |
Number of findings | 7 | 139 | 144 |
Max e-value | 6,00E-58 | 2,00E-36 | 4,00E-43 |
megablast - 214 findings, max e-value = 8E-20 blastn (default parameters) - 351 findings, max e-value = 5E-05 blastn (custom parameters) - 355 findings, max e-value = 2E-09Чувствительные параметры опять немного улучшили качество поиска.
Score E Sequences producing significant alignments: (Bits) Value scaffold-17 108 1e-23 unplaced-307 102 7e-22 scaffold-105 33.9 0.51 unplaced-647 28.1 4.9
> scaffold-17 Length=2125590 Score = 108 bits (269), Expect = 1e-23, Method: Compositional matrix adjust. Identities = 123/491 (25%), Positives = 229/491 (47%), Gaps = 63/491 (13%) Frame = +1 Query 320 HYCPYIDTHDDEKILSYSLKPNQVFAFLRSILVRVF-PKLIWGNQRIFEIILKDLETFLK 378 YCP + DD L+ +P+ V F+R +L++VF G + + + + L Sbjct 610900 QYCPAQSSSDDGLTLNDYSRPHDVKQFVRCVLIKVFRCNFFGGMENLNAFVDNAVGMLLN 611079 Query 379 LSRYESF-SLHYLMSNIKISEIEWLVLGKRSNAKMCLSDFEKRKQ--IFAEFIYWLYNSF 435 L ++ES +++ I+ S I WL + K+ ++ E +K + + WL N F Sbjct 611080 LRKFESMPEASFIVKGIQSSRIMWLRSKLNT*PKV-VNKLEHQKL**LCSSLFQWLLNRF 611256 Query 436 IIPILQSFFYITESSDLRNRTVYFRKDIWKLLCRPFITSMKMEAFEKINENNVRMDTQKT 495 + +L++ F+IT++S +NR Y+R D+W+ R ++ I+ + +T + Sbjct 611257 VSDLLKACFFITDTSHCKNRVFYYRFDLWR---RMVEVQSSIKNLHPIDMG*I--NTGRK 611421 Query 496 TLPPAVIRLLPKKN-TFRLITNLRKRFLIKMGSNKKM--LVSTNQTLRPVASILKHLINE 552 + + IRL+PK+N +FR I NLR + +NK M L+S + L++E Sbjct 611422 FM--S*IRLIPKENGSFRRINNLR-----SVNNNK*MYGLLSDA*CI---------LLSE 611553 Query 553 ESSG--------IPFNLEVYMKLLTFKKDLLKHRMFGRKKYFVRIDIKSCYDRIKQDLMF 604 ++ G + N ++Y +L FK G YFV+ D+ YD I + +F Sbjct 611554 KNYG*IDLLKDIVLSNDDIYARLK*FKMRNKARF*RGD*LYFVKSDVT*AYDSINRQKLF 611733 Query 605 RIVKKKL-KDPEFVIRKYATI-------------HATSDRATKNFVSEAFSYFDMVPFEK 650 +++ D EF+I Y H S RA + F + Sbjct 611734 SVLE*IF**DSEFIIHGY*R*LQLCLLR*F*KLYHKVSIRAE*H-----------QTFPE 611880 Query 651 VVQLLSMKTSDTLFVDFVDYWTKSSSEIFKMLKEHLSGHIVKIGNSQYLQKVGIPQG-SI 709 + L+ ++ +F+D V S +++FK +++ + +I++ + Y+Q+ GIPQG + Sbjct 611881 FCKELAKSIANKVFIDKV**KKVSGADVFKAIEQLIYDNILQFEDGYYVQEEGIPQGSIV 612060 Query 710 LSSFLCHFYMEDLIDEYLSFTKKKGSVLLRVVDDFLFITVNKKDAKKFLNLSLRGFEKHN 769 S Y ++E +FT++ S+L++ +DDFL++T +K A +L+ GF + Sbjct 612061 SSLLCSLLYSHLALNELFTFTRRSDSLLIKFIDDFLYLTFDKA*A*GYLSRI*IGFPDYG 612240 Query 770 FSTSLEKTVIN 780 + +KT N Sbjct 612241 VHMNPKKTATN 612273
Score E Sequences producing significant alignments: (Bits) Value scaffold-199 920 0.0 scaffold-96 744 0.0 scaffold-423 737 0.0 unplaced-999 540 8e-171 unplaced-980 461 9e-142 scaffold-157 285 1e-81 scaffold-693 281 2e-80 unplaced-804 264 2e-74 scaffold-499 262 6e-74 unplaced-959 231 1e-63 scaffold-469 150 5e-43 scaffold-418 150 5e-43 unplaced-113 122 1e-32 scaffold-138 78.6 3e-17 scaffold-61 78.6 3e-17 unplaced-721 43.9 2e-05
Score E Sequences producing significant alignments: (Bits) Value unplaced-665 742 0.0 scaffold-26 693 0.0 unplaced-5 348 1e-105 scaffold-57 348 1e-105 scaffold-423 161 6e-49
Score Expect Method Identities Positives Gaps Frame 369 bits(947) 8e-110 Compositional matrix adjust. 203/407(50%) 257/407(63%) 53/407(13%) -3 Query 12230 KVKTAILLFNLGGPGSLSEVKPFLTRLFSDPDLIELPMSRSSLFNRILALRQESTSTIAQ 12051 K KT I+L N+GGP + +EV FL RLFSD DL+ LP AQ Sbjct 68 KPKTGIMLLNMGGPETTNEVHDFLLRLFSDRDLMVLP---------------------AQ 106 Query 12050 SESTDSKFKGLLSDNVVKEDIPHV*KLFADVITKRRSKKIENQYQQIGGQSPIKKWTTLQ 11871 S+ A I +RR+ KI+ QYQ+IGG SPIK WT Q Sbjct 107 SK-------------------------MAQWIARRRTPKIQEQYQKIGGGSPIKMWTEKQ 141 Query 11870 MEKMVKLLDQVSPHTAPHKPYIAFRYADPLTHDALYQAINDGAERIIGFT*YP*YSCSTT 11691 E M+KLLD + P +APHK YI FRY PLT D L Q +DG ER + FT YP YSCSTT Sbjct 142 GEGMIKLLDDMCPDSAPHKFYIGFRYVKPLTEDTLDQMESDGIERAVAFTQYPQYSCSTT 201 Query 11690 GSSLNELATAVRRLKPELRDKLKMSFIDRWPIQKELVEAFA*NIKSKLDEFPAEDRNCVL 11511 GSSLN + ++ K E + +K S IDRWP LV+AFA N++++L +FPA+ +N V+ Sbjct 202 GSSLNAIYRHYKQ-KGE-KPGIKWSVIDRWPTHPGLVQAFAENVRAELAKFPADVQNEVV 259 Query 11510 LLFSAHSLPMSVVDRGDTYPQEVAATVQAVMERLGHSNPYRLSWQSKVGPSRWLSP*TAD 11331 +LFSAHSLPM VVDRGD YPQEVAATVQ VME L +S+PYRL WQSKVGP WL P T D Sbjct 260 ILFSAHSLPMKVVDRGDPYPQEVAATVQRVMELLNYSHPYRLVWQSKVGPMPWLGPQTED 319 Query 11330 VVSMLGKKSHQKDKNVIIVPVAFTSDHIETLFEIDIELMED-AHKLGL-NMKRCDSLNDS 11157 + L KK KN+++VP+AFTSDHIETL E+DIE E+ AH++G+ N++R SLNDS Sbjct 320 SIKGLAKKG---KKNILLVPIAFTSDHIETLHELDIEYAEEVAHEVGIENIRRAASLNDS 376 Query 11156 ETFIRGMVNLVKGHIDSGFQCSQ*LHMQCPGC*KQSCRNMRETLLQQ 11016 TFI+ M ++VK H+DSG CS+ L ++CP C +C +E L + Sbjct 377 PTFIKAMADVVKAHLDSGVNCSRQLPLRCPMCVNPTCGLAKEFFLNR 423
© Антоненкова Юлия, 2017