Для сравнения выравниваний была выбрана метиониновая аминопептидаза I - фермент,который отщепляет N-концевой аминокислотный остаток метионина у пептидов. Для
сравнения была выбрана аминопептидаза палочки Коха(Mycobacterium tuberculosis) и человека(
Homo sapiens). Было произведено два выравнивания с помощью
двух разных программ.
Первое выравнивание было произведено в рамках множественного выравнивания в программе muscle - для этого были выбраны ещё две последовательности, принадлежащие
сенной палочке(Bacillus subtilis (strain 168)) и пекарским дрожжам (Saccharomyces cerevisiae). После множественного выравнивания из проекта JalView были удалены все последовательности, кроме белков палочки Коха и человека.
Второе выравнивание было сделано с помощью опции Align в UniProt. После выполнения этой опции был скачан fasta-файл с результатами и также визуализирован в JalView.
Поиск отличий в выравниваний производился их сравнением в JalView. Проект с обоими выравниваниями можно скачать здесь


В таблице ниже приведены места, в которых обнаружены отличия в выравниваниях.
| Выравнивание в Uniprot | Выравнивание в muscle | |
| Отличие №1 | Glu134 - Gly19 | Arg105 - Gly19 |
| Отличие №2 | гэп - Glu170 | Gly284 - Glu170 |
| Отличие №3 | Met94 - гэп | Met94 - Arg8 |
Вообще, выравнивания достаточно сильно похожи(что логично, т.к. последовательности одинаковые), единственные отличия заключаются в разном расположении гэпов, из-за которых смещается соответствие между аминокислотами.
Для построения карты локального сходства были выбраны полипротеины полиовируса
Poliovirus type 1 (strain Mahoney) и ящура Foot-and-mouth disease virus (strain A10-61) (Aphthovirus A). Их аминокислотные последовательности были выровнены в BLAST.
Ниже представлена таблица с основной информацией об этих белках.Выдачу BLAST можно посмотреть
здесь.
| Poliovirus type 1 | Foot-and-mouth disease virus | |
| UniProt ID | POLG_POL1M | POLG_FMDV1 |
| UniProt AC | P03300; A0A142KD04; P03299; Q84879; Q84880; Q89679; | P03306; Q64768; Q84750; Q84751; Q84752; Q84753; Q84754; Q84760; Q84761; Q84762; Q84763; Q84764; Q84765; Q84766; Q84767; Q84768; Q84769; Q89824; |
| Full name | Genome polyprotein | |
BLAST выдал 10 локальных выравниваний с разным весом и E-value. Они представлены на рисунке 7. Можно видеть 4 достаточно больших участка, на которых были выровнены
последовательности и 6 маленьких участков, которые, по большому счёту, не нужны, т.к. они короткие и имеют большое значение E-value( от 1.1 и выше)
Поэтому выравнивание было проведено ещё раз, но с другим порогом Expect threshold, равным 0.0001. Полученную выдачу можно посмотреть здесь. С таким строгим значением мы получили более чистую карту.
Ниже представлено лучшее локальное выравнивание из BLAST.
Score:250 bits(638), Expect:5e-70,
Method:Compositional matrix adjust.,
Identities:189/659(29%), Positives:322/659(48%), Gaps:59/659(8%)
Query 1594 GVHDNVAILPTH--ASPGESIVIDGKEVEILDAKALEDQ---AGTNL--EITIITLKRNE 1646
GV ++P H A + I++DG+ + D + E + G ++ + +I L R
Sbjct 1684 GVFGTAYLVPRHLFAEKYDKIMLDGRAMTDSDYRVFEFEIKVKGQDMLSDAALIVLHRGN 1743
Query 1647 KFRDIRPHI--PTQITETNDGVLIVNTSKYPNMYVPVGAVTEQG-YLNLGGRQTARTLMY 1703
RDI H ++ + V +VN + + A+T + + + G Y
Sbjct 1744 CVRDITKHFRDTARMKKGTPVVGVVNNADVGRLIFSGEALTYKDIVVCMDGDTMPGLFAY 1803
Query 1704 NFPTRAGQCGGVITCTGK----VIGMHVGGNGSHGFAAALKRSYFTQSQGEIQWMRPSKE 1759
TRAG CGG + ++G H G G+ + + RS + + + P E
Sbjct 1804 KAATRAGYCGGAVLAKDGADTFIVGTHSAGGNGVGYCSCVSRSMLQKMKAHVD-PEPHHE 1862
Query 1760 VGYPI--------INAPSKTKLEPSAFHYVFEGVKEPAVLTKNDPRLKTD--FEEAIFSK 1809
G + ++ KTKL P+ + VF PA L+ DPRL ++ IFSK
Sbjct 1863 -GLIVDTRDVEERVHVMRKTKLAPTVAYGVFNPEFGPAALSNKDPRLNEGVVLDDVIFSK 1921
Query 1810 YVGN-KITEVDEYM-KEAVDHYAGQLMS-LDINTEQMCLEDAMYGTDGLEALDLSTSAGY 1866
+ G+ K+TE D+ + + YA +L S L + + +A+ G DGL+A++ T+ G
Sbjct 1922 HKGDAKMTEEDKALFRRCAADYASRLHSVLGTANAPLSIYEAIKGVDGLDAMEPDTAPGL 1981
Query 1867 PYVAMGKKKRDILNKQTR----DTKEMQKLLDTYGINLPLVTYVKDELRSKTKVEQGKSR 1922
P+ GK++ +++ + + + KL++ T++KDE+R KV GK+R
Sbjct 1982 PWALQGKRRGALIDFENGTVGPEVEAALKLMEKREYKFACQTFLKDEIRPMEKVRAGKTR 2041
Query 1923 LIEASSLNDSVAMRMAFGNLYAAFHKNPGVITGSAVGCDPDLFWSKIPVLMEE--KLFAF 1980
+++ + + +M G A H N G GSAVGC+PD+ W + + ++
Sbjct 2042 IVDVLPVEHILYTKMMIGRFCAQMHSNNGPQIGSAVGCNPDVDWQRFGTHFAQYRNVWDV 2101
Query 1981 DYTGYDASLSPAWFEALKMVLEKI-----GFGDRVDYI-DYLNHSHHLYKNKTYCVKGGM 2034
DY+ +DA+ +A+ ++ E++ GF ++I L ++ H Y+NK V+GGM
Sbjct 2102 DYSAFDANHCS---DAMNIMFEEVFRTDFGFHPNAEWILKTLVNTEHAYENKRITVEGGM 2158
Query 2035 PSGCSGTSIFNSMINNLIIRTLLLKTYKGIDLDHLKMIAYGDDVIASYPHEVDASLLAQS 2094
PSGCS TSI N+++NN+ + L + Y+G++LD MI+YGDD++ + +++D L
Sbjct 2159 PSGCSATSIINTILNNIYVLYALRRHYEGVELDTYTMISYGDDIVVASDYDLDFEALKPH 2218
Query 2095 GKDYGLTMTPADKS----ATFETVTWENVTFLKRFFRADEKYPFLIHPVMPMKEIHESIR 2150
K G T+TPADKS +++T +VTFLKR F D F PVM K + +
Sbjct 2219 FKSLGQTITPADKSDKGFVLGQSIT--DVTFLKRHFHMDYGTGFY-KPVMASKTLEAILS 2275
Query 2151 WTKDPRNT-QDHVRSLCLLAWHNGEEEYNKFLAKIRSVPIGRALLLPEYSTLYRRWLDS 2208
+ + R T Q+ + S+ LA H+G +EY + P +P Y +LY RW+++
Sbjct 2276 FAR--RGTIQEKLISVAGLAVHSGPDEYRRLFE-----PFQGLFEIPSYRSLYLRWVNA 2327
В поле FT было сказано, что в участках полипротеинов, которые попали в выравнивание, содержатся:
У полиовируса: Protein 3CD, Protease 3C, RNA-directed RNA polymerase
У вируса ящура: Protease 3C, RNA-directed RNA polymerase
То есть выровненные участки кодируют функционально одинаковые белки, это может свидетельствовать о гомологии этих полипротеинов.
К тому же в других локальных выравниваниях полипротеинов тоже оказываются функционально схожие белки. Не очень понятно, как обозначить выравнивания из выдачи
BLAST, поэтому в качестве критерия был использован Range. Поиск белков осуществлялся с помощью записи о полипротеинах в UniProt.
| Range | Белки полиовируса,попавшие в выравнивание | Белки вируса ящура, попавшие в выравнивание |
| Range 1 | Protein 3CD, Protease 3C, RNA-directed RNA-polymerase | Protease 3C, RNA-directed RNA-polymerase |
| Range 2 | Protein 2C | Protein 2C |
| Range 3 | Капсидные белки VP3, VP4 | Белки VP3, VP2 |
| Range 4 | Капсидный белок VP1 | Белок VP1 |
Затем было проведено локальное выравнивание белков программой water [ссылка]. Важно отметить, что штрафы за открытие и продолжение гэпа были выставлены по умолчанию, то есть 10.0 и 0.5 за открытие и продолжение гэпа соответственно.
########################################
# Program: water
# Rundate: Fri 1 May 2020 10:28:38
# Commandline: water
# -asequence sw:P03300
# -bsequence sw:P03306
# Align_format: srspair
# Report_file: polg_pol1m.water
########################################
#=======================================
#
# Aligned_sequences: 2
# 1: POLG_POL1M
# 2: POLG_FMDV1
# Matrix: EBLOSUM62
# Gap_penalty: 10.0
# Extend_penalty: 0.5
#
# Length: 2494
# Identity: 616/2494 (24.7%)
# Similarity: 957/2494 (38.4%)
# Gaps: 655/2494 (26.3%)
# Score: 1533.5
#
#
#=======================================
POLG_POL1M 2 GAQVSSQKVGAHENSNRAYGGSTINYTTINYYRDSASNAASKQ------- 44
||..||...|:...|... ||.|| |||.....|:.|.|
POLG_FMDV1 202 GAGQSSPATGSQNQSGNT--GSIIN----NYYMQQYQNSMSTQLGDNTIS 245
POLG_POL1M 45 ----DFSQD-------------------PSKFTEPIKDVLIKTAPMLNSP 71
:.|.| .|.||. :..|.:.:..
POLG_FMDV1 246 GGSNEGSTDTTSTHTTNTQNNDWFSKLASSAFTG------LFGALLADKK 289
POLG_POL1M 72 NIEACGYSDRVLQLTLGNSTITTQEAANSVVAYGRWPEYLRDSEANPVDQ 121
..|.....||:|....|::|.|||.:.. |.||...| .|..|.|...
POLG_FMDV1 290 TEETTLLEDRILTTRNGHTTSTTQSSVG--VTYGYSTE--EDHVAGPNTS 335
POLG_POL1M 122 PTEPDVA-ACRFYTLDTVSWTKESR-GWWWKLPDALRDMGLFGQNM-YYH 168
..|..|. |.||:......||.:.. |:..||.......|:||..: .|.
POLG_FMDV1 336 GLETRVVQAERFFKKFLFDWTTDKPFGYLTKLELPTDHHGVFGHLVDSYA 385
POLG_POL1M 169 YLGRSGYTVHVQCNASKFHQGALGVFAVPEMCLAGDSNTTTMHTSYQNAN 218
|: |:|:.|.|....::|:.|.|.|..||| ::..:
POLG_FMDV1 386 YM-RNGWDVEVSAVGNQFNGGCLLVAMVPE---------------WKAFD 419
POLG_POL1M 219 PGEKGGTFTGTFTPDNNQTSPARRFCPVDYLLGNGTLLGNAFVFPHQIIN 268
..|| |.| || ||||.|:
POLG_FMDV1 420 TREK-------------------------YQL---TL------FPHQFIS 435
POLG_POL1M 269 LRTNNCATLVLPYVNSLSIDSMVKHNNWGIAILPLAPLNFASESSPEIPI 318
.|||..|.:.:||:.....|...||..|.:.::.|:||..::.::|:|.:
POLG_FMDV1 436 PRTNMTAHITVPYLGVNRYDQYKKHKPWTLVVMVLSPLTVSNTAAPQIKV 485
POLG_POL1M 319 TLTIAPMCCEFNGLRNITLPRLQGL-PVMNTPGSNQYLTADNFQSPCALP 367
...|||......| .||..:|: ||....|....:|.|...:.....
POLG_FMDV1 486 YANIAPTYVHVAG----ELPSKEGIFPVACADGYGGLVTTDPKTADPVYG 531
POLG_POL1M 368 EFDVTPPIDIPGEVKNMMELAE-IDTMIPFDLSATKKNTMEMYRVRLSDK 416
:....|..:.||...|::::|| ..|.:.|| ..|
POLG_FMDV1 532 KVYNPPKTNYPGRFTNLLDVAEACPTFLRFD----------------DGK 565
POLG_POL1M 417 PHTDDPILCLSLSPASDPRL-------------SHTMLGEILNYYTHWAG 453
|:. ::.|.|.|| |:|.|..|..|||.::|
POLG_FMDV1 566 PYV--------VTRADDTRLLAKFDVSLAAKHMSNTYLSGIAQYYTQYSG 607
POLG_POL1M 454 SLKFTFLFCGFMMATGKLLVSYAPPGAD-PPKKRKEAMLGTHVIWDIGLQ 502
::...|:|.|...:..:.:|:|.|||.: ||...:||....|..||.||.
POLG_FMDV1 608 TINLHFMFTGSTDSKARYMVAYIPPGVETPPDTPEEAAHCIHAEWDTGLN 657
POLG_POL1M 503 SSCTMVVPWISNTTYRQTIDD---SFTEGGYISVFYQTRIVVPLSTPREM 549
|..|..:|::|...|..|..| :....|::.|:..|.......|
POLG_FMDV1 658 SKFTFSIPYVSAADYAYTASDTAETTNVQGWVCVYQITHGKAENDT---- 703
POLG_POL1M 550 DILGFVSACNDFSVRLLRDTTHIEQKALAQGLGQMLESMIDNTVRETVGA 599
:|...||..||.:||..|
POLG_FMDV1 704 -LLVSASAGKDFELRLPID------------------------------- 721
POLG_POL1M 600 ATSRDALPNTEASGPTHSKEIPALTAVETGATNPLVPSDT-VQTRHVVQH 648
|.|:.:....|.: |..|.||. ...|| ||.||
POLG_FMDV1 722 -------PRTQTTTTGESAD-PVTTTVEN------YGGDTQVQRRH---- 753
POLG_POL1M 649 RSRSESSIESFFARGACVTIMTVDNPASTTNKDKLFAVWKITYKDTVQLR 698
..:..|.....|.| |..|.|:...|.. |:|..: :.
POLG_FMDV1 754 ------HTDVGFIMDRFVKI----NSLSPTHVIDLMQ----THKHGI-VG 788
POLG_POL1M 699 RKLEFFTYSRFDMELTFVVTANFTETNNGHALNQVYQIMYVPPGAPVPEK 748
..|...||...|:|:......|.| :||.|||
POLG_FMDV1 789 ALLRAATYYFSDLEIVVRHDGNLT---------------WVPNGAP---- 819
POLG_POL1M 749 WDDYTWQTSSNPSIFYTYGTAP-ARISVPYVGISNAYSHFYDGFSKVPLK 797
:.....:|||: .|..|| .|:::||.......:..|||.:|....
POLG_FMDV1 820 --EAALSNTSNPT---AYNKAPFTRLALPYTAPHRVLATVYDGTNKYSAS 864
POLG_POL1M 798 DQSAALGDSLYGAASLNDFGILAVRVVN------DHNPTKVTSKIRVYLK 841
|..: .|.|.:|.||.. ::...:..:...:.::
POLG_FMDV1 865 DSRS------------GDLGSIAARVATQLPASFNYGAIQAQAIHELLVR 902
POLG_POL1M 842 PKHIRVWCPRPPRAVAYYGPGVDYKDGTLTPLSTKDLTTY------GFGH 885
.|...::||||..|:...... .||...:.| .|.|..: |...
POLG_FMDV1 903 MKRAELYCPRPLLAIKVTSQD-RYKQKIIAP--AKQLLNFDLLKLAGDVE 949
POLG_POL1M 886 QNKA------VYTAGYKICNYHLATQDDLQNAVNVMWSRDLLVTESRAQG 929
.|.. |.:...|:.:.....|:|:.......::|.:...|..|.|
POLG_FMDV1 950 SNLGPFFFADVRSNFSKLVDTINQMQEDMSTKHGPDFNRLVSAFEELATG 999
POLG_POL1M 930 TDSI-----------------ARCNCNAGVYYCESRRKYYPVSFVGPTFQ 962
..:| :|.:|.|.|
POLG_FMDV1 1000 VKAIRTGLDEAKPWYKLIKLLSRLSCMAAV-------------------- 1029
POLG_POL1M 963 YMEANNYYPARYQSHMLIGHGFASPGDCGGILRCHHGVIGIITAGGEGLV 1012
.||.:..:|:....|..|
POLG_FMDV1 1030 --------AARSKDPVLVAIMLADTG------------------------ 1047
POLG_POL1M 1013 AFSDIRDLYAYEEEAMEQGITNYIESLGAAFGSGFTQQISDKITELTNMV 1062
:|.|.:.| ..::.||.::.|.::.
POLG_FMDV1 1048 -----------------------LEILDSTF---VVKKSSDSLSSLFHVP 1071
POLG_POL1M 1063 TSTIT---EKLLKNLIKIISSLVIITRNYEDTTTVLATLALLGCDASPWQ 1109
....: ..||..|:|:.||....|. ||.......|
POLG_FMDV1 1072 APAFSFGAPVLLAGLVKVASSFFRSTP--EDLERAEKQL----------- 1108
POLG_POL1M 1110 WLRKKACDVLEIPYVIKQGDSWLKKFTEACNAAKGLEWVSNKISKFIDWL 1159
||.|:.:|..::|.| ||:...|....||:
POLG_FMDV1 1109 ----KARDINDIFAILKNG-----------------EWLVKLILAIRDWI 1137
POLG_POL1M 1160 KEKIIPQARDKLEFVTKLRQLE-MLENQISTIHQSCPSQEHQEILFNNVR 1208
|..|..:.: |||....:. :||.| ..::.....:|.:|.| :|.|
POLG_FMDV1 1138 KAWIASEEK----FVTMTDLVPGILEKQ-RDLNDPGKYKEAKEWL-DNAR 1181
POLG_POL1M 1209 WLSIQS--KRFAPLYAVEAKRIQKLEHTINNYIQFKSKHRIEPVCLLVHG 1256
...::| ...|.|..|.|.. .||.|.|||.:.:.|
POLG_FMDV1 1182 QACLKSGNVHIANLCKVVAPA--------------PSKSRPEPVVVCLRG 1217
POLG_POL1M 1257 SPGTGKSVATNLIARAIAER---ENTSTYSLPPDPSHFDGYKQQGVVIMD 1303
..|.|||...|::|:||:.. ...|.:..||||.|||||.||.||:||
POLG_FMDV1 1218 KSGQGKSFLANVLAQAISTHFTGRIDSVWYCPPDPDHFDGYNQQTVVVMD 1267
POLG_POL1M 1304 DLNQNPDGADMKLFCQMVSTVEFIPPMASLEEKGILFTSNYVLASTN-SS 1352
||.|||||.|.|.|.|||||..|||||||||:||..|.|..::|:|| .|
POLG_FMDV1 1268 DLGQNPDGKDFKYFAQMVSTTGFIPPMASLEDKGKPFNSKVIIATTNLYS 1317
POLG_POL1M 1353 RISPPTVAHSDALARRFAFDMDIQVMNEYSRDGKLNMAMATEMCKNCHQP 1402
..:|.|:...|||.|||.||:|:...:.|..:.||::..|.| ..:.:..
POLG_FMDV1 1318 GFTPRTMVCPDALNRRFHFDIDVSAKDGYKINNKLDIIKALE-DTHTNPV 1366
POLG_POL1M 1403 ANFKRCCPLVCGKAIQL------MDKSSRVRYSIDQITTMIINER----- 1441
|.|:..|.|:.|.|::: |.|......::.|:...:| ||
POLG_FMDV1 1367 AMFQYDCALLNGMAVEMKRLQQDMFKPQPPLQNVYQLVQEVI-ERVELHE 1415
POLG_POL1M 1442 --------------NRRSNIGNCME--------ALFQG-----------P 1458
:::|.:...:| ..|:| |
POLG_FMDV1 1416 KVSSHPIFKQISIPSQKSVLYFLIEKGQHEAAIEFFEGMVHDSVKEELRP 1465
POLG_POL1M 1459 L---------QYKDLKIDIKTSPPPECINDLL------------QAVDSQ 1487
| .:|.||.:.:. ...|:..|. |.:...
POLG_FMDV1 1466 LIQQTSFVKRAFKRLKENFEI--VALCLTLLANIVIMIRETRKRQKMVDD 1513
POLG_POL1M 1488 EVRDYCEKKGWIVNITSQVQT----ERNINRAMTILQAVTTFAAVAGV-- 1531
.|.:|.|: .|||:..:| |:| ...|:.|:..|.
POLG_FMDV1 1514 AVNEYIER----ANITTDDKTLDEAEKN--------PLETSGASTVGFRE 1551
POLG_POL1M 1532 ---------------------------------------VYVMYKLFAGH 1542
:.|..|| ...
POLG_FMDV1 1552 RSLTGQKVRDDVSSEPAQPAEDQPQAEGPYSGPLERQKPLKVRAKL-PQQ 1600
POLG_POL1M 1543 QGAYTG-LPNKKP-----NVPTIRTAKVQGP-GFDYAVAMAKRNI----- 1580
:|.|.| :..:|| ..|.::....:|| ....|:.:..||:
POLG_FMDV1 1601 EGPYAGPMERQKPLKVKVKAPVVKEGPYEGPVKKPVALKVKARNLIVTES 1650
POLG_POL1M 1581 ----------VTATTSKGEFTM----------LGVHDNVAILPTH--ASP 1608
|...|...|..: .||.....::|.| |..
POLG_FMDV1 1651 GAPPTDLQKMVMGNTKPVELNLDGKTVAICCATGVFGTAYLVPRHLFAEK 1700
POLG_POL1M 1609 GESIVIDGKEVEILDAKALEDQ---AGTNL--EITIITLKRNEKFRDIRP 1653
.:.|::||:.:...|.:..|.: .|.:: :..:|.|.|....|||..
POLG_FMDV1 1701 YDKIMLDGRAMTDSDYRVFEFEIKVKGQDMLSDAALIVLHRGNCVRDITK 1750
POLG_POL1M 1654 HI--PTQITETNDGVLIVNTSKYPNMYVPVGAVTEQG-YLNLGGRQTART 1700
|. ..::.:....|.:||.:....:.....|:|.:. .:.:.|......
POLG_FMDV1 1751 HFRDTARMKKGTPVVGVVNNADVGRLIFSGEALTYKDIVVCMDGDTMPGL 1800
POLG_POL1M 1701 LMYNFPTRAGQCGGVITCTGK----VIGMH-VGGNGSHGFAAALKRSYFT 1745
..|...||||.|||.:..... ::|.| .||||. |:.:.:.||...
POLG_FMDV1 1801 FAYKAATRAGYCGGAVLAKDGADTFIVGTHSAGGNGV-GYCSCVSRSMLQ 1849
POLG_POL1M 1746 QSQGEIQWMRPSKEVGYPI--------INAPSKTKLEPSAFHYVFEGVKE 1787
:.:..:. ..|..| |..: ::...||||.|:..:.||.....
POLG_FMDV1 1850 KMKAHVD-PEPHHE-GLIVDTRDVEERVHVMRKTKLAPTVAYGVFNPEFG 1897
POLG_POL1M 1788 PAVLTKNDPRLKTD--FEEAIFSKYVGN-KITEVDE--YMKEAVDHYAGQ 1832
||.|:..||||... .::.||||:.|: |:||.|: :.:.|.| ||.:
POLG_FMDV1 1898 PAALSNKDPRLNEGVVLDDVIFSKHKGDAKMTEEDKALFRRCAAD-YASR 1946
POLG_POL1M 1833 LMS-LDINTEQMCLEDAMYGTDGLEALDLSTSAGYPYVAMGKKKRDILNK 1881
|.| |......:.:.:|:.|.|||:|::..|:.|.|:...||::..:::.
POLG_FMDV1 1947 LHSVLGTANAPLSIYEAIKGVDGLDAMEPDTAPGLPWALQGKRRGALIDF 1996
POLG_POL1M 1882 QT----RDTKEMQKLLDTYGINLPLVTYVKDELRSKTKVEQGKSRLIEAS 1927
:. .:.:...||::.........|::|||:|...||..||:|:::..
POLG_FMDV1 1997 ENGTVGPEVEAALKLMEKREYKFACQTFLKDEIRPMEKVRAGKTRIVDVL 2046
POLG_POL1M 1928 SLNDSVAMRMAFGNLYAAFHKNPGVITGSAVGCDPDLFWSKIPVLMEE-- 1975
.:...:..:|..|...|..|.|.|...||||||:||:.|.:......:
POLG_FMDV1 2047 PVEHILYTKMMIGRFCAQMHSNNGPQIGSAVGCNPDVDWQRFGTHFAQYR 2096
POLG_POL1M 1976 KLFAFDYTGYDASLSPAWFEALKMVLEKI-----GFGDRVDYI-DYLNHS 2019
.::..||:.:||:... :|:.::.|:: ||....::| ..|.::
POLG_FMDV1 2097 NVWDVDYSAFDANHCS---DAMNIMFEEVFRTDFGFHPNAEWILKTLVNT 2143
POLG_POL1M 2020 HHLYKNKTYCVKGGMPSGCSGTSIFNSMINNLIIRTLLLKTYKGIDLDHL 2069
.|.|:||...|:||||||||.|||.|:::||:.:...|.:.|:|::||..
POLG_FMDV1 2144 EHAYENKRITVEGGMPSGCSATSIINTILNNIYVLYALRRHYEGVELDTY 2193
POLG_POL1M 2070 KMIAYGDDVIASYPHEVDASLLAQSGKDYGLTMTPADKS----ATFETVT 2115
.||:||||::.:..:::|...|....|..|.|:|||||| ...:::|
POLG_FMDV1 2194 TMISYGDDIVVASDYDLDFEALKPHFKSLGQTITPADKSDKGFVLGQSIT 2243
POLG_POL1M 2116 WENVTFLKRFFRADEKYPFLIHPVMPMKEIHESIRWTKDPRNT-QDHVRS 2164
:||||||.|..|....| ..|||..|.:...:.:.: |.| |:.:.|
POLG_FMDV1 2244 --DVTFLKRHFHMDYGTGF-YKPVMASKTLEAILSFAR--RGTIQEKLIS 2288
POLG_POL1M 2165 LCLLAWHNGEEEYNKFLAKIRSVPIGRALLLPEYSTLYRRWLDS 2208
:..||.|:|.:||.:... |......:|.|.:||.||:::
POLG_FMDV1 2289 VAGLAVHSGPDEYRRLFE-----PFQGLFEIPSYRSLYLRWVNA 2327
#---------------------------------------
#---------------------------------------
Сразу видно различие в проценте покрытия последовательностей.
| Poliovirus type 1 coverage | Foot-and-mouth disease virus coverage | |
| BLAST | 27,84% | 27,57% |
| water | 99,90% | 91,17% |
То есть локальное выравнивание в water по процентам покрытий может сойти и за глобальное. Но мы будем рассматривать только участок, который был также выровнен и в
BLAST.
Выравнивания в water и в BLAST имеют отличия. Например, индель в water находится в последовательности Poliovirus между аминокислотами Thr1883 - Arg1884. В BLAST же
этот индель находится в позициях Arg1884-Asp1885. Поэтому в water образовалась пара Arg1884 - Pro2003, а в BLAST - Arg1884 - Glu1999.