Парное выравнивание белков

Парное выравнивание - один из основных методов биоинформатики, основанный на сопоставлении последовательостей двух белков.
Здесь приведено еще одна небольшая работа связанная с аденилат-киназой, в которой используется этот метод.

Мутанты

С помощью скрипта evolve_protein.pl были получены мутантные формы трех участков (по 20 аминокислот) моего белка (аденилат-киназы). Скрипт запускался через Putty следующей командой:
perl evolve_protein.pl –i sw:kad_bacsu –o [файл]
Причем, скрипт запускался трижды с разными параметрами change и replacement. Результаты действия скрипта переводился в формат fasta, после чего добавлялись в jar (в программе Jalview) файл вместе с изначальной последовательностью белка в формате fasta. Затем велся поиск мутированных участков в изначальном белке, и проводилось выравнивание “вручную”.
Рисунок 1. Выравнивание мутантного участка с показателями change=0.6 replace=0.8. Аминокислоты изначального белка показаны с 26 по 48. Рисунок 2. Выравнивание участка с показателями change=0.6 replace=0.6 (левее) и участка с показателями change=0.4 replace=0.8 (правее). Аминокислоты изначального белка показаны со 140 по 193.

Далее был посчитан процент identity и similarity для каждого выравнивания. Для этого использовалась формула: Для similarity принимается m=1 при A(i1)=A(i2) или A(i1)?A(i2). Результаты расчета приведены ниже.

Затем был подсчитан все выравниваний с помощью матрицы BLOSUM62.
c=0.6 r=0.8   1+4+4+5-12+6+6+5+6+5+4+0-1-2+5+0-12+5+7-1=45
c=0.6 r=0.8   6+6-1+7+1+5+7-12+6-3+9-4-3-1+6-2+5-12-1+5+5=29
c=0.4 r=0.8   4+5+5-3+5+4+0+5+5+1+5+5-3+4+4-12+6+7-1+5+5=56
 

Ортологи

Был составлен fasta файл, содержащий последовательность исходного белка (KAD_BACSU) и двух его ортологов (KAD_BACA2 и KAD_BACCQ). Чтобы выровнять последовательности используется функция Web services => Alignment => Muscle with default. Ны выходе получаем выравнивание тройное выравнивание. Далее из этого выравнивание выделялось 3 парных выравнивания (SU-A2, SU-CQ, A2-CQ). Информация об этих выравниваниях была получена с помощью команды infoalign.

USANameSequence LengthAligned LengthGapsGap LengthIdentitySimilarityDifference% ChangeWeightDescription
fasta::SU_CQ.fasta:KAD_BACSU/1-217 KAD_BACSU/1-217 217 217 0 0 217 0 0 0.000000 1.000000 Adenylate kinase;
fasta::SU_CQ.fasta:KAD_BACCQ/1-216 KAD_BACCQ/1-216 216 216 0 0 156 27 33 27.777779 1.000000 Adenylate kinase;

USANameSequence LengthAligned LengthGapsGap LengthIdentitySimilarityDifference% ChangeWeightDescription
fasta::SU_A2.fasta:KAD_BACSU/1-217 KAD_BACSU/1-217 217 217 0 0 217 0 0 0.000000 1.000000 Adenylate kinase;
fasta::SU_A2.fasta:KAD_BACA2/1-217 KAD_BACA2/1-217 217 217 0 0 207 4 6 4.608295 1.000000 Adenylate kinase;

USANameSequence LengthAligned LengthGapsGap LengthIdentitySimilarityDifference% ChangeWeightDescription
fasta::A2_CQ.fasta:KAD_BACA2/1-217 KAD_BACA2/1-217 217 217 0 0 217 0 0 0.000000 1.000000 Adenylate kinase;
fasta::A2_CQ.fasta:KAD_BACCQ/1-216 KAD_BACCQ/1-216 216 216 0 0 155 27 34 28.240740 1.000000 Adenylate kinase;

Тройственное выравнивание было окрашено по схеме ClustalX, порог identity ntreshold был выбран так, чтобы окрашивались только участки, где минимум две аминокислоты совпадают (он равен 1%).
Рисунок 3. Участок тройного выравнивания с 40 по 60 аминоксилоту.


Главная страница Первый семестр Второй семестр Обо мне Ссылки

© Марк Меерсон, 2013
Последнее обновление: 22.03.2013