<< BACK

Оптимальное парное выравнивание.
Алгоритмы

Задание №1

Для сравнения глобального и локального парных выравниваний были взяты два белка - DNAK_HALMA и HSP7C_HUMAN. Выравнивания были построены с помощью команд пакета EMBOSS. ЕMBOSS содержит две программы: needle - для глобального выравнивания и water - для локального выравнивания. Затем программа EMBOSS вычисляет основные свойства выравниваний,результат которых представлен в таблице 1. Для обоих программ штраф за гэпы следующие: gapopen 10,0, gapextend 0,5; для глобального выравнивания endweight Y, endopen 10,0, endextend. Матрица весов для обеих программ - EBLOSUM62. Локальное и глобальное выравнивания отличаются концевым участком: в локальном выравнивании последовательности обрезаны по консервативным 612 и 639 остаткам глицина, так как за ними почти нет участков гомологии и присутствуют большие индели. За счет этого локальное выравнивание становится короче - вырезается два инделя. В остальных позициях оба выравнивания идентичны, но вырезание лишних гэпов дает локальному выравниванию больший вес. В этом случае локальное выравнивание более информативно при меньших размерах, поскольку чаще приходится сравнивать внутрибелковые структуры, а не концевые, так как первые больше подверженны эволюционным факторам.

Taблица 1. Основные свойства обоих видов выравниваний

Тип выравниванияДлина выравниванияЧисло гэповПроцент гэповЧисло инделейа.к.па.к.п, % ф.к.пф.к.п, %Вес выравнивания
Локальное (water)650497,541530246,4641664,001378
Глобальное (needle)673659,661730545,3242062,411367

Рис 1. Глобальное выравнивание DNAK_HALMA и HSP7C_HUMAN. Окрашено по схеме ClustalX, 100% идентичность.


Рис 2. Локальное выравнивание DNAK_HALMA и HSP7C_HUMAN. Окрашено по схеме ClustalX, 100% идентичность.


Таким образом, локальное и глобальное выравнивания представляют собой в определенной степени идентичные выравнивания, отличающиеся концевыми участками. Глобальное показывает гомологию между концевыми остатками, тогда как в локальном наоборот.



Задание №2

Для анализа выравниваний негомологичных белков были построены локальные выравнивания аминокислотной последовательности белка MarR (ADX57967.1) попарно с последовательностями белка ANE87960.1 (белок репарации алкилированной ДНК), ацетил - КоА синтазой (BAC69532.1), гликозил - трансферазой (ADX55361.1), AKQ41279.1, AMD46139.1. При построении выравнивания мной использовалась программа water EMBOSS, штраф за индель 10.0, за каждый следующий гэп 0.5, матрица весов - EBLOSUM62.

Taблица 2. Локальное попарное выравнивание негомологичных и гомологичных белков.

GenBankДлина последовательностиДлина выравниванияЧисло гэповПроцент гэповЧисло инделейа.к.па.к.п, %ф.к.пф.к.п, %Вес выравнивания
AAV48029.1635650385,851130246,4641664,001378
AAH19816.1646650111,69430246,4641664,00
ADX57967.11665000,0001530,002448,0036,5
ANE87960.12375036,0021530,002448,00
ADX57967.11661271914,9643124,415240,9443,5
BAC69532.17151271310,2433124,415240,94
ADX57967.11661541610,3943824,685435,0658,0
ADX55361.14391542818,1823824,685435,06
ADX57967.11661743117,8264022,996436,7844,0
AKQ41279.176817474,0224022,996436,78
ADX57967.11662084521,6364220,197335,1045,5
AMD46139.1452208209,6244220,197335,10

Процент гэпов в локальном выравнивании негомологичных последовательностей ДОЛЖЕН БЫТЬ значительно больше, а процент абсолютно консервативных и функционально консервативных позиций - меньше. На рисунках 3 и 4 представлены выравнивания негомологичных последовательностей ADX57967.1 и ANE87960.1; ADX57967.1 и AMD46139.1, соответственно. Первое выравнивание в несколько раз короче самих последовательностей и представляет собой концевые участки, в которых обнаружилось НАИБОЛЬШЕЕ сходство. Его (выравнивания) параметры консервативности имеют значения несколько больше, чем у некоторых остальных выравниваний ПРЕДПОЛОЖИТЕЛЬНО негомологичных последовательностей, и в примерно на столько же меньше, чем соответствующие параметры у выравнивания гомологичных последовательностей (например, 1-ая пара в табл.). Мной было построено глобальное выравнивание ADX57967.1 и ANE87960.1 (Рис. 5) и выяснено, что локальное выравнивание ПОЛНОСТЬЮ СООТВЕТСТВУЕТ части глобального. Это натолкнуло меня на мысль, что эти участки ВЕРОЯТНО действительно гомологичны, учитывая, что ОБА БЕЛКА МОГУТ ВЗАИМОДЕЙСТВОВАТЬ С ДНК (т.е. функционально схожи). На рисунке 5 я выделил этот участок, который, по моему мнению, можно рассмотреть как болк. Выравнивание последней (относительно табл.) пары последовательностей (рис.4) представляет собой чередование в шахматном порядке участков с гэпами и а.к.о. А это точно НЕ свидетельствует о гомологии данных последовательностей.


Рис.3 Выравнивания негомологичных последовательностей ADX57967.1 и ANE87960.1.


Рис.4 Выравнивания негомологичных последовательностей ADX57967.1 и AMD46139.1


Рис.5 Глобальное выравнивание последовательностей ADX57967.1 и ANE87960.1.


Используемая цветовая схема позволяет оценить консервативность выравнивания. Предполагается, что применяемая цветовая схема будет окрашивать функционально идентичные остатки в бледно-голубой, отчасти это имеет место. Таким образом, мы можем продемонстриовать наиболее консервативные участки. Можно с уверенностью утверждать, что выравнивающие программы предоставляют возможность отличать гомологичные и не гомологичные белки на основе описанных признаков.


Задание №3

Для сравнения парных выравниваний, полуженных из множественного выравнивания Jalview, программами needle и water из EMBOSS я взял два белка использованных ранее - DNAK_HALMA и HSP7C_HUMAN. В программе Jalview я сравнил три выравнивания гомологичных последовательностей в одном окне, назначив каждому свою группу. Выравнив выравнивания относительно друг друга, не меняя колонки внутри выравниваний, я нашел некоторые отличия. Как уже было отмечено выше, локальное и глобальное выравнивания отличаются только концевыми участками, так что речь пойдет об отличиях этих парных выравниваний от части множественного выравнивания. Верхние две строчки - глобальное выравнивание, две посередине - локальное, две снизу - часть от множественного выравнивания.


Рис.5 Глобальное выравнивание последовательностей ADX57967.1 и ANE87960.1.


Становится возможным сделать вывод: все выравнивания в общем-то идентичны, однако есть несколько несоответствий. В позиции 78 фенилаланин в верхней последовательности стоит в колонке с гэпом в нижней в локальном и глобальном выравниваниях. В множественном в этой позиции стоит гэп в верней и аспарагиновая кислота в нижней. Фенилаланин в множественном выравнивании стоит в 79 позиции напротив тирозина, последний в других выравниваниях стоит в 104 позиции. В позиции 113 глутаминовая кислота стоит напротив лизина во множественном выравнивании, однако в парных выравниваниях этот а.к.о. стоит в 111 позиции напротив так же глутаминовой кислоты. Группа остатков IDSLY в позициях выравнивания 288 - 292 стоит напротив группы IATTD в парных выравниваниях, во множественном она сдвинута влево на три позиции и гомологична LPFIA. Глутаминовая кислота и глицин из позиций 294 - 295 множественного выравнивания гомологичны глицину и пролину, в то время как в парных выравниваниях они стоят в позицях 293 - 294 и гомологичны аспарагиновой кислоте и глицину, образуют косервативность в позиции 294 по глицину. Наиболее правдоподобное выравнивание - это парное локальное. Но имеются некоторые проблемы, связанные с гомологичностью внутренних остатков (гомологичность парных остатков, находящихся "под вопросом", представляется более вероятной) и ведет себя странно в конце последовательностей. Сравнивая локальное и глобальное выравнивания, нужно сказать, что в этом конкретном случае нет необходимости в выравнивании конечного «хвоста», так как с точностью нельзя предположить, что произошло в ходе эволюции.