Матрицы аминокислотных замен. Карта локального сходства

1. Карта локального сходства двух полипротеинов

В качестве полипротеинов для задания были взяты полипротеин вируса полиомиелита P03301 и полипротеина вируса ящура P03306.

Таблица 1. Характеристики двух лучших выравниваний
Local alignment Identities, % Positives, % Length Gaps Score (standard) Score, bits
Alignment 1(1684-2327) 29% 49% 644 59 644 252
Alignment 2(1121-1383) 37% 51% 263 26 398 157

Зрелые белки, к которым относится участок полипротеина с 1684 по 2327 аминокислоту: Picornain 3C и RNA-directed RNA polymerase 3D-POL. Зрелые белки, к которым относится участок полипротеина с 1121 по 1383 аминокислоту: Protein 2C.

2. Сравнение веса выравнивания со случайным

•Идентификаторы предположительно гомологичных белков: ODO1_ECOLI и ODO1_BACSU

•Вес локального выравнивания: 1724.5

•Медиана весов выравниваний белка ODO1_ECOLI со 100 перемешанными последовательностями белка ODO1_BACSU: 79.25

•Верхний квартиль весов выравниваний белка ODO1_ECOLI со 100 перемешанными последовательностями белка ODO1_BACSU: 87.25

•Вес локального выравнивания в битах: 26.7

•Вероятность получить такое же или лучшее выравнивание по случайным причинам: 9·10-9

Видно, что вероятность случайно получить выравнивание с таким же или большим весом, нежели исходный, крайне мала, что говорит в пользу гомологичности белков ODO1_ECOLI и ODO1_BACSU.


•Идентификаторы предположительно неродственных белков: YPDA_ECOLI и RISA_BACSU

•Вес локального выравнивания: 40.0

•Медиана весов выравниваний белка RISA_BACSU со 100 перемешанными последовательностями белка YPDA_ECOLI: 42.5

•Верхний квартиль весов выравниваний белка RISA_BACSU со 100 перемешанными последовательностями белка YPDA_ECOLI: 48.25

•Вес локального выравнивания в битах: 0.6

•Вероятность получить такое же или лучшее выравнивание по случайным причинам: 0.66

Таким образом, 66 из 100 случайных выравниваний будут лучше исходного выравнивания. Это подтверждает то, что белки YPDA_ECOLI и RISA_BACSU неродственные.

2a. Эффект смены параметров

При увеличении штрафа удлинение инделя (до 4) уменьшились вес оптимального локального выравнивания (до 1611.0), длины выравнивания и количество гэпов, что логично: программа старается теперь сделать выравнивание так, чтобы компенсировать увеличение штрафов за удлинение инделя (это привело к уменьшению веса) и для этого уменьшила количество гэпов и, как следствие, длина выравнивания тоже уменьшилась. Далее, медиана и верхний квартиль стали равны 40.0 и 42.0 соответственно. Это объясняется так же, плюс при урезании количества гэпов уменьшается шанс, что выравнивание будет удачным. Вес в битах сильно увеличился (до 786.5), а p-значение стало фактически равно нулю, то есть выравнивание с весом 1611.0 при штрафе за удлинение инделя равным 4 - вообще лучшее, какое могло только быть. Таким образом, увеличение штрафа за удлинение инделя ведет к уменьшению количества возможных хороших выравниваний.

3. BLAST: поиск гомологов в банке

Таблица 2. Выравнивания белка BAU39574.1 c гомологичными ему белками
ID AC Organism Identities, % Positives, % Length Gaps Score (standard) Score, bits Expect Query cover, %
Q8MP00 NPF_AEDAE Aedes aegypti (Yellowfever mosquito) (Culex aegypti) 31% 60% 45 2 70 31.6 3.6 8.4%
Q6D2N1 MNMC_PECAS Pectobacterium atrosepticum (strain SCRI 1043 / ATCC BAA-672) (Erwinia carotovora subsp. atroseptica) 34% 41% 51 11 77 33.1 5.9 12.2%

© Агаева Зара, 2018