Глобальное и локальное выравнивание аминокислотных последовательностей

Программы, с которыми мы работали: needle, water, matcher (пакет EMBOSS)

Матрица переходов глобального и локального выравнивания

Матрица глобального выравнивания для последовательностей NPDVD и PDV Глобальное выравнивание выполнялось для последовательностей NPDVD и PDV. Параметры для построения матрицы: вес совпадения 2, вес замены -1, штраф за делецию -2.

Оптимальное выравнивание:
Вес оптимального пути: 2

1 NPDVD 5
   |||
1 -PDV- 3

Матрица локального выравнивания для последовательностей RLEFSIYRY и LEYRY Локальное выравнивание выполнялось для последовательностей RLEFSIYRY и LEYRY. Параметры для построения матрицы те же.

Оптимальное выравнивание:
Вес оптимального пути: 6
Вес субоптимального пути: 4

2 LE 3
  ::
1 LE 2

7 YRY 9
  :::
3 YRY 5

Поиск участков локальной гомологии

Использовалась программа matcher из пакета EMBOSS. В качестве первой последовательности был взят мой белок (sw:P07014, он же DHSB_ECOLI, он же Succinate dehydrohenase iron-sulphur protein). Его последовательность приведена ниже:

MRLEFSIYRY NPDVDDAPRM QDYTLEADEG RDMMLLDALI QLKEKDPSLS FRRSCREGVC GSDGLNMNGK NGLACITPIS ALNQPGKKIV IRPLPGLPVI RDLVVDMGQF YAQYEKIKPY LLNNGQNPPA REHLQMPEQR EKLDGLYECI LCACCSTSCP SFWWNPDKFI GPAGLLAAYR FLIDSRDTET DSRLDGLSDA FSVFRCHSIM NCVSVCPKGL NPTRAIGHIK SMLLQRNA

Вторая последовательность - совокупность его же фрагментов SIYRYNPDVD NPTRAIGHIK (т.е. АКО с 6 по 15 и с 221 по 230, подчёркнуты в основной последовательности). Ниже приведены результаты работы программы. В первом случае идентичность (identity) 78.6%, а похожесть (similarity) 75.7% - из-за того, что следующие АКО белка оказались схожи с началом второго фрагмента, поэтому программа включила и их; во втором же случае сходство идеальное. Таким образом, хотя программа и выдаёт выгодные результаты, они именно выгодны с точки зрения алгоритма, но не всегда точны, и нужен контроль человека во избежание повторения похожих ситуаций.

6 SIYRYNPDVDDAPR 19
  ::::::::::.  :
1 SIYRYNPDVDNPTR 14

221 NPTRAIGHIK 230
    ::::::::::
11  NPTRAIGHIK 20

Влияние параметров на глобальное выравнивание

Для глобального выравнивания использовалась программа needle из пакета EMBOSS с разными параметрами. Последовательности выбраны те же, что описаны выше во 2й части. Ниже приведены фрагменты двух наиболее различающихся вариантов:

Матрица выравнивания BLOSUM80, штраф за открытие делеции -1, штраф за её продолжение -1. Вес выравнивания: 129.
Матрица выравнивания BLOSUM62, штраф за открытие делеции -10, штраф за её продолжение -1. Вес выравнивания: 54.

Видно, что первое выравнивание сильно растянуто и пестрит делециями, а второе, наоборот, сжатое и без гэпов (gap - пробел). Это объясняется высокой "ценой" открытия делеций, при которой они просто "не окупаются". Если взять выравнивание BLOSUM62, но с параметрами, как в первом случае, то видно, что понижаются идентичность и похожесть, и выравнивание получает меньше очков.

6 SIYRYNPDVDDAPRMQDYTLEADEGRDMMLLDALI-QLK 43
  ||||||||||: |     |      |      | | ::|
1 SIYRYNPDVDN-P-----T------R------A-IGHIK 20

6 SIYRYNPDVDDAPRMQDYTL 25
  ||||||||||:..|...:..
1 SIYRYNPDVDNPTRAIGHIK 20

На главную страницу