Найдем с помощью сервиса BLAST последовательности из геномов бактерий, гомологичные WP_012611422.1, в базе данных RefSeq (условия поиска BLAST, взятые с сайта NCBI, находятся в файле pr11-query.asn). Было найдено 3272 предполагаемых гомолога (то есть последовательностей, для которых E-value < 0.001). Среди них есть те, для которых покрытие полученным локальным выравниванием последовательности-запроса превышает 80% : таких результатов 28. Далее приведено описание некоторых результатов из выдачи BLAST: лучшего по E-value (WP_007521493.1), худшего (WP_053550070.1) и произвольного из середины списка (WP_057104610.1):
WP_007521493.1 | WP_057104610.1 | WP_053550070.1 | |
Длина выравнивания | 317 | 289 | 64 |
bit score | 655 | 221 | 37.4 |
% идентичных а.о. | 99 | 42 | 34 |
% сходных а.о. | 99 | 59 | 50 |
E-value | 0.0 | 1e-67 | 9.3 |
Далее приведены выравнивания для этих белков с исходным, полученные в BLAST:
Query 1 MKISIGLGKEGVEERLAERGVSRRDFLKFCTAIAVTMGMGPAFAPEVARALMGPRRPSVV 60 MKISIGLGKEGVEERLAERGVSRRDFLKFCTAIAVTMGMGPAFAPEVARALMGPRRPSVV Sbjct 1 MKISIGLGKEGVEERLAERGVSRRDFLKFCTAIAVTMGMGPAFAPEVARALMGPRRPSVV 60 Query 61 YLHNAECTGCSESVLRAFEPYIDTLILDTLSLDYHETIMAAAGDAAEAALEQAVNSPHGF 120 YLHNAECTGCSESVLRAFEPYIDTLILDTLSLDYHETIMAAAG+AAEAALEQAVNSPHGF Sbjct 61 YLHNAECTGCSESVLRAFEPYIDTLILDTLSLDYHETIMAAAGEAAEAALEQAVNSPHGF 120 Query 121 IAVVEGGIPTAANGIYGKVANHTMLDICSRILPKAQAVIAYGTCATFGGVQAAKPNPTGA 180 IAVVEGGIPTAANGIYGKVANHTMLDICSRILPKAQAVIAYGTCATFGGVQAAKPNPTGA Sbjct 121 IAVVEGGIPTAANGIYGKVANHTMLDICSRILPKAQAVIAYGTCATFGGVQAAKPNPTGA 180 Query 181 KGVNDALKHLGVKAINIAGCPPNPYNLVGTIVYYLKNKAAPELDSLNRPTMFFGQTVHEQ 240 KGVNDALKHLGVKAINIAGCPPNPYNLVGTIVYYLKNKAAPELDSLNRPTMFFGQTVHEQ Sbjct 181 KGVNDALKHLGVKAINIAGCPPNPYNLVGTIVYYLKNKAAPELDSLNRPTMFFGQTVHEQ 240 Query 241 CPRLPHFDAGEFAPSFESEEARKGWCLYELGCKGPVTMNNCPKIKFNQTNWPVDAGHPCI 300 CPRLPHFDAG FAPSFESEEARKGWCLYELGCKGPVTMNNCPKIKFNQTNWPVDAGHPCI Sbjct 241 CPRLPHFDAGRFAPSFESEEARKGWCLYELGCKGPVTMNNCPKIKFNQTNWPVDAGHPCI 300 Query 301 GCSEPDFWDAMTPFYQN 317 GCSEPDFWDAMTPFYQN Sbjct 301 GCSEPDFWDAMTPFYQN 317
Query 43 FAPEVARALMGPRRPSVVYLHNAECTGCSESVLRAFEPYIDTLILDTLSLDYHETIMAAA 102 P +A AL R VV++H ECT C+ES +R+ P +IL +SLDY +T+MAAA Sbjct 1 MTPRIAWALENKPRIPVVWIHGLECTCCTESFIRSSHPLAKDVILSLISLDYDDTLMAAA 60 Query 103 GDAAEAALEQAVNSPHG-FIAVVEGGIPTAANGIYGKVANHTMLDICSRILPKAQAVIAY 161 G AE E ++ HG +I VEG P G++ ++ + A A+IA+ Sbjct 61 GTQAEEVFEDILSRYHGRYILAVEGNPPLGEQGMFCISGGRPFIEKLKKAAAGASAIIAW 120 Query 162 GTCATFGGVQAAKPNPTGAKGVNDALKHLGVKAINIAGCPPNPYNLVGTIVYYLKNKAAP 221 GTCA++G VQAA+PNPT A ++ + + + + GCPP P + I Y + P Sbjct 121 GTCASWGCVQAARPNPTQATPIDKVITDKPI--VKVPGCPPIPDVMSAIITYMVTFGRLP 178 Query 222 ELDSLNRPTMFFGQTVHEQCPRLPHFDAGEFAPSFESEEARKGWCLYELGCKGPVTMNNC 281 ELD L RP MF+GQ +H++C R HFDAGEF S++ + ARKG+CLY++GCKGP T N C Sbjct 179 ELDRLGRPLMFYGQRIHDKCYRRAHFDAGEFVESWDDDAARKGYCLYKMGCKGPTTYNAC 238 Query 282 PKIKFN-QTNWPVDAGHPCIGCSEPDFWD 309 ++N ++P+ +GH C+GCSE FWD Sbjct 239 STTRWNGGVSFPIQSGHGCLGCSENGFWD 267
Query 152 LPKAQAVIAYGTCATFGGVQAAKPNPTGAKGVNDALKHLGVKAINIAGCPPNPYNLVGTI 211 +P+ + VIA G CA GG P VN+ L L + I GCPP+PY ++ + Sbjct 191 IPEPKLVIASGACAIGGGPYRDSPE------VNNGLGDLLPVDLYIPGCPPHPYTVLDGL 244 Query 212 VYYL 215 + L Sbjct 245 LRML 248
Среди результатов поиска есть те, которые можно считать гомологами целой исходной последовательности (E-value < 0.001, Query cover ≥ 70%): таких последовательностей 77.
Было построено множественное выравнивание выборки из 20 гомологов исходного белка; в полученном выравнивании мало блоков (возможно, из-за жестких условий на количество абсолютно консервативных последовательностей), участки на концах выравнивания сильно различаются у разных последовательностей.
При сравнении выравниваний исходного белка и одного из гомологов, полученных из MUSCLE, BLAST, needle и water можно отметить, что все полученные выравнивания попарно различны; приведем пример участка, на котором выравнивания различаются:
LILDT--L LLETAG-I LILDT--L L-LETAGI LILDT--L L-LETAGI LILDT--L LLETAG-I
Приведенный участок — отрезок [85;92] из полученной совокупности выравниваний (одно под другим расположены последовательно выравнивания, полученные в MUSCLE, water, needle и blast)
Кроме данного сравнения, было проведено сравнение выравниваний двух негомологичных белков: WP_012611422.1 и WP_010971478.1, полученных в программах needle и water. Полученные выравнивания оказались идентичными (то есть локальное выравнивание water целиком входило в глобальное выравнивание needle).
Ссылка на файл с проектом JalView: pr11.jvp