Глобальное выравнивание выполнялось для последовательностей
NPDVD
и PDV
. Параметры для построения матрицы: вес совпадения 2, вес замены -1, штраф за делецию -2.
Оптимальное выравнивание: Вес оптимального пути: 2 |
|
Локальное выравнивание выполнялось для последовательностей
RLEFSIYRY
и LEYRY
. Параметры для построения матрицы те же.
Оптимальное выравнивание: Вес оптимального пути: 6 Вес субоптимального пути: 4 |
|
|
Использовалась программа matcher из пакета EMBOSS. В качестве первой последовательности был взят мой белок (sw:P07014, он же DHSB_ECOLI, он же Succinate dehydrohenase iron-sulphur protein). Его последовательность приведена ниже:
MRLEFSIYRY NPDVDDAPRM QDYTLEADEG RDMMLLDALI QLKEKDPSLS FRRSCREGVC GSDGLNMNGK NGLACITPIS ALNQPGKKIV IRPLPGLPVI RDLVVDMGQF YAQYEKIKPY LLNNGQNPPA REHLQMPEQR EKLDGLYECI LCACCSTSCP SFWWNPDKFI GPAGLLAAYR FLIDSRDTET DSRLDGLSDA FSVFRCHSIM NCVSVCPKGL NPTRAIGHIK SMLLQRNA
Вторая последовательность - совокупность его же фрагментов SIYRYNPDVD NPTRAIGHIK
(т.е. АКО с 6 по 15 и с 221 по 230, подчёркнуты в основной последовательности). Ниже приведены результаты работы программы. В первом случае идентичность (identity) 78.6%, а похожесть (similarity) 75.7% - из-за того, что следующие АКО белка оказались схожи с началом второго фрагмента, поэтому программа включила и их; во втором же случае сходство идеальное. Таким образом, хотя программа и выдаёт выгодные результаты, они именно выгодны с точки зрения алгоритма, но не всегда точны, и нужен контроль человека во избежание повторения похожих ситуаций.
|
|
Для глобального выравнивания использовалась программа needle из пакета EMBOSS с разными параметрами. Последовательности выбраны те же, что описаны выше во 2й части. Ниже приведены фрагменты двух наиболее различающихся вариантов:
Видно, что первое выравнивание сильно растянуто и пестрит делециями, а второе, наоборот, сжатое и без гэпов (gap - пробел). Это объясняется высокой "ценой" открытия делеций, при которой они просто "не окупаются". Если взять выравнивание BLOSUM62, но с параметрами, как в первом случае, то видно, что понижаются идентичность и похожесть, и выравнивание получает меньше очков.
|
|