Глобальное и локальное выравнивание аминокислотных последовательностей

Программы, с которыми мы работали: needle, water, matcher (пакет EMBOSS)

  • Матрица переходов глобального и локального выравнивания

  • Матрица глобального выравнивания для последовательностей NPDVD и PDV Глобальное выравнивание выполнялось для последовательностей NPDVD и PDV. Параметры для построения матрицы: вес совпадения 2, вес замены -1, штраф за делецию -2.

    Оптимальное выравнивание:
    Вес оптимального пути: 2
    1 NPDVD 5
    |||
    1 -PDV- 3

    Матрица локального выравнивания для последовательностей RLEFSIYRY и LEYRY Локальное выравнивание выполнялось для последовательностей RLEFSIYRY и LEYRY. Параметры для построения матрицы те же.

    Оптимальное выравнивание:
    Вес оптимального пути: 6
    Вес субоптимального пути: 4
    2 LE 3
    ::
    1 LE 2
    7 YRY 9
    :::
    3 YRY 5
  • Поиск участков локальной гомологии

  • Использовалась программа matcher из пакета EMBOSS. В качестве первой последовательности был взят мой белок (sw:P07014, он же DHSB_ECOLI, он же Succinate dehydrohenase iron-sulphur protein). Его последовательность приведена ниже:

    MRLEFSIYRY NPDVDDAPRM QDYTLEADEG RDMMLLDALI QLKEKDPSLS FRRSCREGVC GSDGLNMNGK NGLACITPIS ALNQPGKKIV IRPLPGLPVI RDLVVDMGQF YAQYEKIKPY LLNNGQNPPA REHLQMPEQR EKLDGLYECI LCACCSTSCP SFWWNPDKFI GPAGLLAAYR FLIDSRDTET DSRLDGLSDA FSVFRCHSIM NCVSVCPKGL NPTRAIGHIK SMLLQRNA

    Вторая последовательность - совокупность его же фрагментов SIYRYNPDVD NPTRAIGHIK (т.е. АКО с 6 по 15 и с 221 по 230, подчёркнуты в основной последовательности). Ниже приведены результаты работы программы. В первом случае идентичность (identity) 78.6%, а похожесть (similarity) 75.7% - из-за того, что следующие АКО белка оказались схожи с началом второго фрагмента, поэтому программа включила и их; во втором же случае сходство идеальное. Таким образом, хотя программа и выдаёт выгодные результаты, они именно выгодны с точки зрения алгоритма, но не всегда точны, и нужен контроль человека во избежание повторения похожих ситуаций.

    6 SIYRYNPDVDDAPR 19
    ::::::::::. :
    1 SIYRYNPDVDNPTR 14
    221 NPTRAIGHIK 230
    ::::::::::
    11 NPTRAIGHIK 20
  • Влияние параметров на глобальное выравнивание

  • Для глобального выравнивания использовалась программа needle из пакета EMBOSS с разными параметрами. Последовательности выбраны те же, что описаны выше во 2й части. Ниже приведены фрагменты двух наиболее различающихся вариантов:

    1. Матрица выравнивания BLOSUM80, штраф за открытие делеции -1, штраф за её продолжение -1. Вес выравнивания: 129.
    2. Матрица выравнивания BLOSUM62, штраф за открытие делеции -10, штраф за её продолжение -1. Вес выравнивания: 54.

    Видно, что первое выравнивание сильно растянуто и пестрит делециями, а второе, наоборот, сжатое и без гэпов (gap - пробел). Это объясняется высокой "ценой" открытия делеций, при которой они просто "не окупаются". Если взять выравнивание BLOSUM62, но с параметрами, как в первом случае, то видно, что понижаются идентичность и похожесть, и выравнивание получает меньше очков.

    6 SIYRYNPDVDDAPRMQDYTLEADEGRDMMLLDALI-QLK 43
    ||||||||||: | | | | | ::|
    1 SIYRYNPDVDN-P-----T------R------A-IGHIK 20
    6 SIYRYNPDVDDAPRMQDYTL 25
    ||||||||||:..|...:..
    1 SIYRYNPDVDNPTRAIGHIK 20