Я рассмотрела 2 белка: ENO_BACSU и ENO_MYCTU. Сначала построила множественное выравнивание с еще двумя их гомологами из других видов программой muscle и взяла из него только эти два белка. Потом построила парные выравнивания программами needle и water. Три парных выравнивания программами muscle, water, needle соответственно. В таблице 1 представлены 4 различия между этими выравниваниями.
Таблица 1.
muscle | D:250 K:251 | Y:254 Y:256 | E:257 S:259 | T:252 D:253 |
water | -:"250" K:251 | Y:254 H:257 | E:257 E:261 | D:250 D:253 |
needle | -:"250" K:251 | Y:254 H:257 | E:257 E:261 | D:250 D:253 |
Понятно, что между глобальным и локальным выравниваниями нет различий, кроме длины (глобальное выравнивание длиннее на 8 последних аминокислот). А вот между первым и двумя вторыми выравниваниями есть различия, обусловленные не только сдвигами первого выравнивания на парные гэпы (которые появились сначала во множественном выравнивании). Вероятно, более оптимальны 2ое и 3е выравнивания, но ход эволюционных событий отражает, скорее всего, первое выравнивание, потому что в нем учитываются буквы на данных позициях у ближайших родственников данных белков.
Затем я построила множественное выравнивание muscle всех шести. Оно оказалось не очень информативным, так как 1 и 3 выравнивания теперь совпали. Интереснее выравнивание тех же белков в T-Coffee.
2. Орграф для глобального выравнивания с аффинными штрафами за гэпы.Спуск на нижний ряд - это штраф за начало инделя (g), а каждая пройденная грань в нижнем ряду - штраф за продолжение инделя (h). Штрафов за концевые гэпы нет.
Рисунок 1.Орграф с аффинными штрафами за гэпы.
Локальное выравнивание - в рамке.
Рисунок 2.Орграф с линейными штрафами за гэпы.
Ж | Ф | |
Ж | 8 | 25 |
Ф | 23 | 34 |
Ожидаемая частота:
qж = 0,35
qф = 0,65
qж*qж = 0,1225
qж*qф = 0,2275
qф*qж = 0,2275
qф*qф = 0,4225
Наблюдаемая частота:
pжж = 8/90 = 0,089
pжф = 25/90 = 0,28
pфж = 23/90 = 0,26
pфф = 34/90 = 0,38
Веса дружелюбности:
Sжж = 100 * lg(pжж/qж*qж)= -14
Sжф = 100 * lg(pжф/qж*qф)= 9
Sфж = 100 * lg(pфж/qф*qж)= 5
Sфф = 100 * lg(pфф/qф*qф)= -5
Таблица 2. Матрица весов дружелюбности.
Ж | Ф | Сумма | |
Ж | -14 | 9 | 5 |
Ф | 5 | -5 | 0 |
Сумма | 9 | 4 |
Выходит, что биоинЖенеры весьма недружелюбны друг к другу, а, если учесть, что более дружелюбен тот, кто подсаживается справа, то еще и менее дружелюбны к биоинФорматикам, чем биоинФорматики к биоинЖенерам.
© Belousova Evgenia, 2018