Глобальное и локальное выравнивание аминокислотных последовательностей

Программы пакета EMBOSS для построения выравниваний:

Часть1. Матрица переходов.


Были даны последовательности: MFGLF и FGL
При построении матриц переходов были использованы следующие параметры:
Глобальное выравнивание Локальное выравнивание
Оранжевым цветом выделен оптимальный путь выравнивания, его вес равен 3.

Полученное выравнивание:
MFGLF
F-GL-

Можно заметить,что выравнивание построено не совсем оптимальным способом.
Розовым цветом выделен оптимальный путь выравнивания, голубым - субоптимальный путь. Вес оптимального пути равен 6, субоптимального равен 4.

Полученные выравнивания:
YLKN
YL-N
NFW
NFW

Часть2. Поиск участков локальной гомологии.

Анализ результатов, полученных с помощью программы построения локального выравнивания matcher.
Последовательности, для которых строилось выравнивание включали в себя последовательность белка LacY

MYYLKNTNFWMFGLFFFFYFFIMGAYFPFFPIWLHDINHISKSDTGIIFAAISLFSLLFQ
PLFGLLSDKLGLRKYLLWIITGMLVMFAPFFIFIFGPLLQYNILVGSIVGGIYLGFCFNA
GAPAVEAFIEKVSRRSNFEFGRARMFGCVGWALCASIVGIMFTINNQFVFWLGSGCALIL
AVLLFFAKTDAPSSATVANAVGANHSAFSLKLALELFRQPKLWFLSLYVIGVSCTYDVFD
QQFANFFTSFFATGEQGTRVFGYVTTMGELLNASIMFFAPLIINRIGGKNALLLAGTIMS
VRIIGSSFATSALEVVILKTLHMFEVPFLLVGCFKYITSQFEVRFSATIYLVCFCFFKQL
AMIFMSVLAGNMYESIGFQGAYLVLGLVALGFTLISVFTLSGPGPLSLLRRQVNEVA


и искусственно созданной последовательность, которая состояла из двух коротких участков последовательности LacY:

NTNFWMFGLFLSGPGPLSLL

При помощи данной программы можно определить координаты двух участков, из которых была построена вторая последовательность:

для NTNFWMFGLF - с 6 по 15 (включительно)
для LSGPGPLSLL - с 400 по 409 (включительно)

С помощью программы matcher были получены локальные выравнивания:

LACY_E
seq3
    NTNFWMFGLF
    ::::::::::
    NTNFWMFGLF

LACY_E
seq3
    FTLISVFTLSGPGPLSLL
    : ....: ::::::::::
    FWMFGLF-LSGPGPLSLL
Для третьего выравнивания нельзя было выяснить координаты последовательности, так как полностью совпадений было довольно мало.

Часть3. Влияние параметров на глобальное выравнивание.

Используя матрицу аминокислотных замен EBLOSUM62, программой needle были построены глобальные выравнивания для тех же последовательностей, что и в части 2. В первом случае выравнивание осуществлялось при следующих параметрах:
штраф за открытие делеции = 10
штраф за продолжение делеции = 1

1.



В втором случае выравнивание осуществлялось при следующих параметрах:
штраф за открытие делеции = 1
штраф за продолжение делеции = 1

2.



Различия выравнивания видны сразу. В первом случае штраф за отрытие делеции высок, а программа стремится к максимальной цене выравнивания, поэтому почти нет гепов. Во втором случае штрав за делецию существенно ниже, поэтому мы видим на выравнивании довольно большое количество гэпов. Матрицы аминокислотных замен также влияют на выравнивание. При разных параметрах матриц (EBLOSUM80, EBLOSUM62, EBLOSUM40), которые задают разные эволюционные расстояния, получаются отличия в выравнивании (на рис. №2 при задании матрицы EBLOSUM62 меньше гэпов, чем на рис.№3 при задании матрицы EBLOSUM80, так как программа при использовании EBLOSUM80 старается добиться максимального сходства даже при большом количестве гэпов). Для матрицы ЕBLOSUM80 последовательности сходны не более чем на 80% процентов, для EBLOSUM62 - не более чем на 60% и для EBLOSUM40 не более чем на 40%.

3.



Данная задача являлась учебной и помогла понять механизм действия программ needle и matcher. Говоря о смысле данного выравнивания, нужно подчеркнуть, что его нет, потому что мы выравнивали куски последовательности с целой последовательностью одного и того же белка.

Назад