Глобальное и локальное выравнивание амнокислотных последовательностей.

1.Матрицы переходов.

Последовательности, для которых строилась матрица переходов:
a)для глобального выравнивания:
>seq1
TGNTE
>seq2
GNT
б)для локального выравнивания:
>seq1
ITGIFFGSD
>seq2
TGGSD
Параметры, использовавшиеся при построении матрицы:
а)для случая глобального выравнивания:
Штраф за делецию (т.е. за горизонтальный или вертикальный переход между ячейками матрицы)=2,
штраф за замену(т.е. за несовпадение аминокислотных остатков при диагональном переходе)=1,
цена за соападение(т.е. за совпадение аминокислотных остатков при диагональном переходе) =2.
Во втором слева столбце матрицы стоят значения, соответствующие горизонтальному переходу, во втором сверху-значения, соответствующие горизонтальному переходу.

Матрицы переходов:
а)для глобального выравнивания: б)для локального выравнивания
Жёлтым выделен оптимальный путь выравнивания.
Вес этого выравнивания=2
Свойство оптимального пути таково, что очевидно этот путь бутет преимущесвенно всегда идти по диагонали.
На этой диагонали стоят самые большие числа из всей матрицы переходов.
Выравнивание для данного пути выглядит следующим образом:
Первый из возможных вариантов локального выравнивания:

Это оптимальное выравнивание и вес этого выравнивания равен:6.
Второй из возможных вариантов локального выравнивания:

Это субоптимальное выравнивание и вес этого выравнивания равен:4.

2.Поиск участков локальной гомологии.

Эта часть посвящена анализу результатов, полученных с помощью программы построения локального выравнивания matcher.
Последовательности, для которых было построено локальное выравнивание:
>uniprot|P23243|FLAV_ECOLI Flavodoxin 1.
MAITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYG EAQCDWDDFFPTLEEIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW PTAGYHFEASKGLADDDHFVGLAIDEDRQPELTAERVEKWVKQISEELHLDEILNA
//
>seq3
FFGSDTGNTEKWVKQISEEL
//

Третья последовательность содержит два участка из последовательности FLAV_ECOLI, их координаты:7-15(16) и 158(159)-168 аминокислотные остатки.
С помощью программы matcher было получено 3 варианта локальных выравниваний (были намеренно заданы такие параметры,исходя из которых matcher выдал 3 выравнивания):
Параметры:
Matrix(матрица): EBLOSUM62
Gap_penalty(штраф за открытие делеции): 10
Extend_penalty(штраф за продление делеции): 1
Результаты первого варианта локального выравнивания:
Length(длина фрагмента): 20
Identity: 13/20 (65.0%)
Similarity: 15/20 (75.0%)
Gaps: 0/20 ( 0.0%)
Score: 68

Результаты второго варианта локального выравнивания:
Length: 11
Identity: 11/11 (100.0%)
Similarity: 11/11 (100.0%)
Gaps: 0/11 ( 0.0%)
Score: 57
Результаты третьего варианта локального выравнивания:
Length: 18
Identity: 5/18 (27.8%)
Similarity: 7/18 (38.9%)
Gaps: 0/18 ( 0.0%)
Score: 23
Вообще выравнивания проводились при помощи трёх различных программ:needle, water, matcher.
Needle-это программа для глобального выравнивания,поэтому он не режет более длинную последовательность (пишет результаты для полных последовательностей)=> идентичность 2-х аминокислотных последовательностей плучилась равной 13/175 или 7.4%, а количество гэпов получилось равным 155 из 175 (88.6%), similarity=15/175, т.к. есть две спокойно взаимозаменяемые аминокислоты.
Water сделал локальное выравнивание ,и идентичность двух фрагментов получилась равной 13/20 (65%), т.е. количество совпавших аминокислот такое же ,как и в needle(13); similarity фрагментов=15/20, т.е. 15 похожих аминокислотных остатков, как и в needle.
Matcher выдал по своему усмотрению три наиболее удачных выравнивания, но при этом он порезал обе последовательности для получения более или менее удачных совпадений аминокислотных последовательностей: в первом случае он сделал то же самое, что и water; во втором случае он выбрал из двух последовательностей участки, идентичные на 100%, длина этих участков оказалась равной 11; в третьем случае он также выбрал участки из двух последовательностей, но в этот раз идентичность=5/18, similarity=7/18. Гэпов нет.
Выравнивание было произведено с учётом матрицы EBLOSUM62.
Если вторая последовательность представляет из себя целый белок (что мало вероятно), то эволюционное расстояние между организмами очень, очень велико(для глобального выравнивания).
Если вторая последовательность-это какой-либо участок из глобальной аминокислотной последовательности, соответствующий либо активному центру, либо ещё какому-то несущему значительную функциональную нагрузку фрагменту, то эти белки могут быть либо из одного семейсва, либо иметь сходные функции в организме, но при этом не обязательно, что эти организмы эволюционно близки (например, prostaglandin H synthase присутствует как в кораллах,так и в млекопитающих. Она имеет и там , и там сходные функции и два активных цетра, аминокислотные последвательности вокруг которых идентичны, другой пример -это хромофоры...)

3.Влияние параметров на глобальное выравнивание.

Первое выравнивание:

было проведено при следующих параметрах:
gapopen(штраф за открытие делеции)=1,
gapextend(штраф за продление делеции)=1,
"шаблонная" матрица-EBLOSUM40.
Второе выравнивание:

было проведено при следующих параметрах:
gapopen(штраф за открытие делеции)=1,
gapextend(штраф за продление делеции)=1,
"шаблонная" матрица-EBLOSUM80.
Чем больше число при матрице, тем сильнее программа пытается найти совпадения аминокислот в последовательностях, даже если при этом появляется большое количество гэпов.При выравнивании по матрице BLOSUM80 needle нашёл для ок.80% аминокислотных остатков в фрагменте идентичных в большой последовательности. Для BLOSUM62 могло не совпадать в двух последовательностях ок.40% аминокислот. Всю цепочку умозаключений портит выравнивания по BLOSUM40.Можно подумать, что BLOSUM62 яв-ся своего рода точкой симметрии: BLOSUM80 выравнивает и ставит в соответствие с большой последовательностью первый участок, а BLOSUM40- второй участок. Вообще программа ищет лучший путь для выравнивания ,поэтому в зависимости от того, какой штраф мы накладываем за делеции и пр. ,она строит выравнивания с различным количеством гэпов.
Для наглядности два выравнивания:
а)для параметров:
Маирица-EBLOSUM62,
Штраф за открытие делеции=1,
Штраф за продление делеции=1.

б)Маирица-EBLOSUM62,
Штраф за открытие делеции=10,
Штраф за продление делеции=1.